В статье приводятся результаты применения методов машинного обучения для исследования данных специальной анкеты, учитывающей общие характеристики авиарейсов, характеристики пассажиров и их мнения о различных аспектах авиарейса. Цель исследования - выявление в экспериментальных данных факторов, негативно влияющих на отношение пассажиров к услугам авиакомпании. При проведении исследования были использованы популярные алгоритмы, входящие в состав свободного программного обеспечения для анализа данных и машинного обучения, университета Вайкато (Новая Зеландия) WEKA, распространяемого по лицензии GNU GPL: наивный байесовский классификатор; многослойный перцептрон, использующий алгоритм обратного распространения ошибки; метод ближайших соседей (KNN) с адаптивным подбором параметров; деревья решений - алгоритм J48, который является аналогом на Java известного алгоритма C4.5; случайный лес; логистическая регрессия; алгоритм адаптивного бустинга (AdaBoost); машина опорных векторов - алгоритм SMO (Sequential Minimal Optimization), являющийся одной из возможных реализаций алгоритма машины опорных векторов. Показано, что наилучшие по точности модели, отражающие удовлетворенность пассажиров услугами авиакомпании, получаются с помощью алгоритмов «случайный лес» (погрешность на тестовой выборке - 3,9 %) и нейросетевого подхода (погрешность на тестовой выборке - 3,7 %). Вместе с тем, указанные алгоритмы не позволяют явным образом выделить факторы, характерные для авиапассажиров, не удовлетворенных качеством обслуживания. Этот пробел восполняет алгоритм на основе метода структурного резонанса в многомерных данных SRMD, позволивший выявить в данных точные логические правила, обладающие высокой полнотой. Полученные логические правила являются хорошо интерпретируемыми паттернами пассажиров, которые либо отрицательно, либо нейтрально оценивают услуги авиакомпании в целом. Полный текст статьи в переводе на английский язык публикуется во второй части данного выпуска.
Растущая сложность современных систем обработки видеоинформации и ограниченные сроки их проектирования требуют применения новых инструментов разработки, используемых в современных системах автоматизированного проектирования и основанные на программируемых логических интегральных схемах (ПЛИС). В настоящее время в дополнение к традиционным языкам описания аппаратного обеспечения (hardware description languages - HDL) всё большую популярность набирают инструменты высокоуровневого синтеза (High Level Synthesis - HLS) микроархитектур, преимущество которых состоит в повышении уровня абстракции при разработке различных систем обработки сигналов, в частности изображений в области транспорта. Несмотря на простоту проектирования и тестирования в сравнении HDL, при использовании HLS необходимо учитывать недостатки, проявляющиеся при генерации описания аппаратного обеспечения, свойственные данному подходу. В статье на примере проектирования известного фильтра Кэнни, позволяющего выделить границы транспортных объектов на изображениях при решении задач обнаружения и распознавания, представлено сравнительное исследование двух методик синтеза цифровых устройств обработки изображений: HLS и HDL. Приведены результаты сравнения двух реализаций HDL и HLS, полученные на основании оценки вычислительных ресурсов и времени выполнения операций. Поскольку фильтр Кэнни, как и многие другие фильтры выделения контуров, является сверточным, данная работа позволяет оценить сильные и слабые стороны любого оператора в области обработки изображений. Исследование показало, что с учетом затрачиваемых ресурсов и времени отклика реализация HLS продемонстрировала более высокие показатели с точки зрения задействования ресурсов и времени отклика в сравнении с подходом HDL.