ISSN 2541-8637
Язык: ru

Статья: АЛГОРИТМ ОБНАРУЖЕНИЯ ПОТЕНЦИАЛЬНЫХ ПРОТИВОРЕЧИЙ МЕЖДУ SMART-СТАНДАРТАМИ НА ОСНОВЕ КЛАСТЕРИЗАЦИИ И ОЦЕНКИ EMD (2025)

Читать онлайн

В статье рассматривается подход к выявлению противоречий между нормативными документами на естественном языке с использованием методов искусственного интеллекта. Внедрение «умных» стандартов, которые позволяют машинам автоматически понимать и применять нормативные требования, является важным этапом цифровой трансформации, однако на практике интеграция таких стандартов с традиционными нормативными документами неизбежна. При этом наличие противоречий между разными стандартами существенно усложняет их автоматическое применение и вызывает сбои в работе информационных систем. Автором предлагается новый подход к автоматизированному выявлению потенциальных противоречий, основанный на кластеризации текстовых данных с последующим анализом дисперсии эмбеддингов нормативных положений. Используется модель больших языковых эмбеддингов «text-embedding-ada-002», что позволяет преобразовать тексты в семантические векторные представления. Далее применяются методы кластеризации и количественный анализ внутрикластерной дисперсии, а также метрика оптимального транспорта (Earth Mover’s Distance) для оценки различий между группами нормативных положений. Проведённые эксперименты на синтетических данных показали, что предложенный подход способен выявлять более 70% искусственно внесённых противоречий, однако выявлено значительное количество ложноположительных результатов, обусловленных влиянием различий в структуре и мета-данных документов. Полученные предварительные результаты демонстрируют возможность автоматизированного выделения областей потенциальных противоречий для последующего экспертного анализа. Практическая значимость работы заключается в создании программного решения, позволяющего автоматизировать поиск противоречий в больших массивах нормативной документации и обеспечить корректность взаимодействия как между системами, так и между человеком и машиной. Материалы статьи будут полезны разработчикам интеллектуальных систем автоматизации нормативной документации и специалистам, занимающимся цифровой трансформацией в сфере стандартизации.

Ключевые фразы: умные стандарты, нормативные документы, машинное обучение, языковые модели, эмбеддинги, КЛАСТЕРИЗАЦИЯ, выявление противоречий, цифровая трансформация, формальная верификация, автоматизация стандартизации, искусственный интеллект, обработка естественного языка, цифровизация нормативных документов
Автор (ы): Проказин Михаил Русланович
Журнал: МЕХАТРОНИКА, АВТОМАТИКА И РОБОТОТЕХНИКА

Предпросмотр статьи

Идентификаторы и классификаторы

УДК
006. Стандартизация и стандарты
Для цитирования:
ПРОКАЗИН М. Р. АЛГОРИТМ ОБНАРУЖЕНИЯ ПОТЕНЦИАЛЬНЫХ ПРОТИВОРЕЧИЙ МЕЖДУ SMART-СТАНДАРТАМИ НА ОСНОВЕ КЛАСТЕРИЗАЦИИ И ОЦЕНКИ EMD // МЕХАТРОНИКА, АВТОМАТИКА И РОБОТОТЕХНИКА. 2025. № 15
Текстовый фрагмент статьи