ISSN 2541-8637
Язык: ru

Статья: ГИБРИДНЫЙ ПОДХОД К РАСПОЗНАВАНИЮДЕЙСТВИЙ ЧЕЛОВЕКАОПЕРАТОРА В КОЛЛАБОРАТИВНЫХ РОБОТИЗИРОВАННЫХ СРЕДАХ С ИСПОЛЬЗОВАНИЕМ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ И КОМПЬЮТЕРНОГО ЗРЕНИЯ (2025)

Читать онлайн

Предложен гибридный подход по распознаванию действий человека-оператора в коллаборативных роботизированных средах, сочетающий методы компьютерного зрения и большие языковые модели. Разработана модифицированная метрика WSAA, позволяющая оценивать полученные результаты с учетом точности и адаптивности модели. Наилучшие результаты показала модель Llama3.2-Vision, продемонстрировав высокую точность распознавания и устойчивость к изменениям в условиях окружающей среды. Предложенный подход может быть применен для повышения эффективности взаимодействия человека и робота в промышленных условиях.

Ключевые фразы: определение действий, llm, ключевые точки, РОБОТИЗИРОВАННЫЕ СИСТЕМЫ, коботы, искусственный интеллект
Автор (ы): Грабарь Даниил Михайлович, Иванов Юрий Сергеевич
Журнал: МЕХАТРОНИКА, АВТОМАТИКА И РОБОТОТЕХНИКА

Предпросмотр статьи

Идентификаторы и классификаторы

УДК
004.896. Искусственный интеллект в промышленных системах. Интеллектуальные САПР и АСУ. Интеллектуальные роботы
Для цитирования:
ГРАБАРЬ Д. М., ИВАНОВ Ю. С. ГИБРИДНЫЙ ПОДХОД К РАСПОЗНАВАНИЮДЕЙСТВИЙ ЧЕЛОВЕКАОПЕРАТОРА В КОЛЛАБОРАТИВНЫХ РОБОТИЗИРОВАННЫХ СРЕДАХ С ИСПОЛЬЗОВАНИЕМ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ И КОМПЬЮТЕРНОГО ЗРЕНИЯ // МЕХАТРОНИКА, АВТОМАТИКА И РОБОТОТЕХНИКА. 2025. № 15
Текстовый фрагмент статьи