Дата публикации: 20.03.2025

Применение алгоритмов кластеризации для решения задач криминалистического исследования документов и их реквизитов

Аннотация

В статье описаны принцип работы и пределы использования метода кластеризации для решения отдельных задач криминалистического исследования документов. На примере исследования рукописных реквизитов документов рассмотрен порядок применения метода кластеризации для установления исполнителя краткой рукописной записи, а также исключения из числа возможных исполнителей рукописной записи по имеющимся образцам почерка. По результатам проведенных исследований высказаны предложения, направленные на расширение возможностей использования метода кластеризации при исследовании реквизитов документов.




В настоящее время для работы с объектами судебных экспертиз все чаще применяются методы, в основу которых заложены алгоритмы математической обработки данных с помощью машинного обучения, одним из которых является кластеризация. Термин «кластеризация» (clustering) ввел американский психолог и статистик Роберт Трайон в 1939 г. Он использовал этот термин для описания метода группировки объектов по сходству их характеристик.

В 1950–1960-е годы развитие методов кластерного анализа продвинулось дальше благодаря работам статистиков, математиков и специалистов в области машинного обучения, использующих эту концепцию. Например, Джон Тьюки ввел понятие иерархической кластеризации, позволяющей строить дерево кластеров на основе сходства данных. Одной из наиболее известных является его работа «Exploratory Data Analysis» («Исследовательский анализ данных»), в которой рассмотрены и использованы методы кластеризации. Тьюки представил концепцию иерархической кластеризации и показал, как это помогает визуализировать структуру данных и выявлять закономерности, а также аномалии и необычные паттерны, не свойственные для исследуемых объектов.

С появлением электронных вычислительных машин (ЭВМ) кластерный анализ стал использоваться более широко благодаря возросшей вычислительной мощности при обработке данных. Одним из пионеров применения кластерного анализа с использованием возможностей ЭВМ был Джон Ланкастер, британский статистик, который впервые описал метод k-средних в 1967 г. В дальнейшем этот метод стал популярен, для работы с ним широко используются компьютерные программы, написанные с целью повышения скорости выполнения операций по обработке собранных данных.

На протяжении всего развития основной целью кластеризации было разделение набора данных на группы (кластеры) таким образом, чтобы объекты внутри одного кластера были максимально похожи друг на друга, а объекты из разных кластеров отличались.

Из множества алгоритмов кластеризации можно выделить следующие, наиболее популярные виды:

Список литературы

1. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков [и др.]. Москва : Финансы и статистика, 1989. 607 с.
2. Бессонов А.А. Искусственный интеллект и математическая статистика в криминалистическом изучении преступлений : монография / А.А. Бессонов. Москва : Проспект, 2021. 816 с.
3. Ту Д.Т. Принципы распознавания образов / Д.Т. Ту, Р.К. Гонсалес ; перевод с английского И.Б. Гуревича ; под редакцией Ю.И. Журавлева. Москва : Мир, 1978. 411 с.
4. Костюченко О.Г. Практическое значение использования современных технико-криминалистических средств для раскрытия и расследования преступлений / О.Г. Костюченко // Эксперт-криминалист. 2021. № 3. С. 35–37.
5. Мухамадиева З.Б. Спектральная кластеризация данных / З.Б. Мухамадиева, С.А. Салимов // Молодой ученый. 2019. № 9 (247). С. 88–90.
6. Хмелёва А.В. Отдельные вопросы получения следователем образцов для сравнительного исследования / А.В. Хмелёва, И.А. Цховребова // Эксперт-криминалист. 2022. № 3. С. 22–24.
7. Lancaster J. The Isolation of Groups in Large Massive Data Sets / J. Lancaster. 1967. 108 p.
8. Ester M. A density-based algorithm for discovering clusters in large spatial databases with noise / M. Ester, H.-P. Kriegel, J. Sander [et al.] // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). AAAI Pre
9. Tryon R.C. Cluster Analysis; Correlation Profile and Orthometric (Factor) Analysis for the Isolation of Unities in Mind and Personality / R.C. Tryon. Ann Arbor, Michigan : Edwards brother, inc., lithoprinters and publishers. 1939. 122 p.
10. Tuke J.W. Exploratory Data Analysis / J.W. Tuke. Addison-Wesley : Publishing Company Reading, Mass, 1977. 688 s.

Остальные статьи