Решается задача построения суррогатной модели для быстрого вычисления оценок переобучения семейства пороговых решающих правил. Описан процесс сбора обучающей выборки для модели, которая состоит из пар <объект, ответ>, и каждым объектом является семейство пороговых решающих правил, ответом - оценка обобщающей способности семейства. На основе имеющихся исследований оценок обобщающей способности, проведённых в рамках комбинаторной теории переобучения, сформирован перечень признаков, которые описывают объекты выборки. Рассмотрены модели различной структуры, наилучшей по результатам тестирования выбрана модель нейронной сети с точностью 2.8 %. По итогам анализа значимости признаков показано, что при построении оценок переобучения недостаточно учитывать только количество классификаторов и минимальное число ошибок классификаторов, необходимо использовать внутреннюю структуру семейства (расслоение по числу ошибок) и взаимосвязь между классификаторами (связность). Полученную модель можно использовать в задачах отбора признаков при построении деревьев решений, нейронных сетей и в алгоритмах бустинга для контроля переобучения.
Идентификаторы и классификаторы
Большое количество научных и технических областей деятельности сталкивается с необходимостью компьютерного моделирования для изучения сложных явлений реального мира или решения сложных проблем проектирования. Например, чтобы найти оптимальную форму аэродинамического профиля для крыла самолёта, инженер симулирует воздушный поток вокруг крыла для разных переменных формы (длина, кривизна, материал и т. д.) [1].
Список литературы
1. Besnard E., Schmitz A., Boscher E. et al. Two-dimensional aircraft high lift system design and optimization // Proceedings of the 36th AIAA Aerospace Sciences Meeting and Exhibit, Reno, NV, USA. AIAA 98-0123.
2. Forrester A. I. J., Sobester A., Keane A. J. Engineering Design Via Surrogate Modelling: A Practical Guide. John Wiley & Sons, 2008.
3. Simpson T. W., Toropov V., Balabanov V., Viana F. A. C Design and analysis of computer experiments in multidisciplinary design optimization: a review of how far we have come or not // Proceedings of the 12th AIAA/ISSMO Multidisciplinary Analysis and Optimization Conference (Victoria, British Columbia, Canada, 10-12 September 2008).
4. Mogilicharla A., Mittal P., Majumbar S., Mitra K. Kriging surrogate based multi-objective optimization of bulk vinyl acetate polymerization with branching // Materials and Manufacturing Processes. 2015. No. 30. P. 394-402.
5. Гарифуллин М., Барабаш А., Наумова Е. и др. Суррогатное моделирование для определения начальной жёсткости вращения сварных трубчатых соединений // Инженерно-строит. журн. 2016. Т. 3, № 63. С. 53-76.
6. Бурнаев Е., Ерофеев П., Зайцев А. и др. Суррогатное моделирование и оптимизация профиля крыла самолета на основе гауссовских процессов [Электронный ресурс]. URL: http://itas2012.iitp.ru/pdf/1569602325.pdf (дата обращения: 14.07.2024).
7. Ишкина Ш. Х. Комбинаторные оценки переобучения пороговых решающих правил // Уфим. мат. журн. 2018. Т. 10, № 1. С. 50-65.
8. Ишкина Ш. Х., Воронцов К. В. Исследование завышенности оценок переобучения пороговых решающих правил // Автоматика и телемеханика. 2021. № 5. С. 151-168. EDN: MKTHUF
9. Ишкина Ш. Х., Воронцов К. В., Давлетбаев А. Я. и др. Применение комбинаторных оценок переобучения при планировании трассерных исследований в нефтегазовых месторождениях // Искусственный интеллект и принятие решений. 2024. № 1. С. 68-78. EDN: VAUPCE
10. Vorontsov K. V., Ivahnenko A. A. Tight combinatorial generalization bounds for threshold conjunction rules // 4th International Conference on Pattern Recognition and Machine Intelligence, 2011. Lecture Notes in Computer Science. Springer-Verlag, 2011. P. 66-73.
11. Вапник В. Н., Червоненкис А. Я. О равномерной сходимости частот появления событий к их вероятностям // Теория вероятностей и её применения. 1971. Т. 16, № 2. С. 264-279.
12. Воронцов К. В. Точные оценки вероятности переобучения // Докл. РАН. 2009. Т. 429, № 1. С. 15-18. EDN: KYGMJD
13. Vorontsov K. V. Exact combinatorial bounds on the probability of overfitting for empirical risk minimization // Pattern Recognition and Image Analysis. 2010. Vol. 20, no. 3. P. 269-285.
14. Vorontsov K. V. Splitting and similarity phenomena in the sets of classifiers and their effect on the probability of overfitting // Pattern Recognition and Image Analysis. 2009. Vol. 19, no. 3. P. 412-420.
15. Воронцов К. В., Фрей А. И., Соколов Е. А. Вычислимые комбинаторные оценки вероятности переобучения // Машинное обучение и анализ данных. 2013. T. 1, № 6. С. 734-743. EDN: RSJSDJ
16. Гуз И. С. Конструктивные оценки полного скользящего контроля для пороговой классификации // Мат. биология и биоинформатика. 2011. Т. 6, № 2. С. 173-189.
17. Фрей А. И., Толстихин И. О. Комбинаторные оценки вероятности переобучения на основе кластеризации и покрытий множества алгоритмов // Машинное обучение и анализ данных. 2013. T. 1, № 6. С. 761-778. EDN: RSJSED
18. Pedregosa F., Varoquaux G., Gramfort A. et al. Scikit-learn: Machine Learning in Python // JMLR. 2011. Vol. 12, no. 85. P. 2825-2830.
19. Cover T. M., Thomas J. A. Elements of Information Theory. John Wiley & Sons, 2012.
20. Fryer D., Stru¨mke I., Nguyen H. Shapley values for feature selection: The good, the bad, and the axioms // IEEE Access. 2021. Vol. 9. P. 144352-144360. EDN: RGQNGC
Выпуск
Другие статьи выпуска
Представлен обзор ключевых эконометрических моделей, адаптированных для анализа процессов в странах с неоднородной освоенностью территорий и различиями в социально-экономической и институциональной структурах. Рассматриваются модели и их модификации, учитывающие территориальную неоднородность. Приводится описание методологии и результатов исследований, использующих пространственные эконометрические подходы к анализу российских данных.
The process of phase formation in the Fe-Sn reaction crucible under current stressing with and without thermal insulation of the outer walls of the crucible was studied. Numerical simulations by means of the Comsol Multiphysics software were performed in order to establish the correlation of the observed features of phase formation with the magnitude of the calculated internal temperature gradients. The impact of temperature gradients on the kinetics of phase formation was established. The necessity of using heat-insulating felts to reach temperature equilibrium in the diffusion zone of a reaction crucible system was demonstrated.
Исследование направлено на разработку макроскопической континуальной модели динамической деформации пористых металлов на основе применения искусственных нейронных сетей. Для обучения ИНС используются наборы данных, полученные моделированием сжатия представительных объёмов пористой среды методом гидродинамики сглаженных частиц на основе ранее параметризованной для меди модели дислокационной пластичности. Такое моделирование применяется как для набора обучающих данных, так и для исследования физики деформации пористой меди с порами микрометрового и миллиметрового масштаба.
Выполнено полуэмпирическое и первопринципное исследование углеродных соединений, состоящих из взаимопроникающих графиновых слоёв, называемых автоинтеркалированными. В результате расчётов изучена возможность формирования одномерных автоинтеркалированных наноструктур и трёхмерных фаз с упорядоченной структурой на основе шести основных типов графиновых слоёв. Наиболее устойчивые автоинтеркалированные наноструктуры могут быть сформированы только из слоёв α-графина-1 и β1-графина-2, которые характеризуются параметрами трансляции 6.89 и 14.6 ˚A соответственно. Трёхмерные фазы из этих автоинтеркалированных слоёв должны обладать тетрагональной I4/mcm (№ 140) или ромбической Ibam (№ 72) симметрией, размерами каналов от 6.00 до 9.42 ˚A и плотностью от 0.69 до 1.26 г/см3. Молекулярно-динамические расчёты показали, что при температуре 400 К графиновые слои в структуре автоинтеркалированных фаз могут волнообразно деформироваться. Экспериментальную идентификацию новых трёхмерных автоинтеркалированных фаз можно выполнить с помощью расчётных рентгенограмм и абсорбционных рентгеновских спектров.
Выполнено численное моделирование в среде COMSOL Multiphysics процесса химической пропитки из газовой фазы порошка вольфрама с целью установления закономерностей между остаточной пористостью самокомпозита и параметрами синтеза. Также экспериментально исследовано влияние параметров процесса химической инфильтрации из газовой фазы порошка вольфрама на глубину его пропитки и плотность полученных заготовок. Установлено, что главным фактором, обусловливающим максимальную глубину пропитки, является скорость осаждения вольфрама из газовой фазы.
Рассматриваются критические состояния дискретно-неоднородных соединений в условиях плоской деформации. Граница между участками разной прочности предполагается двухзвенной ломаной или содержит такой фрагмент. Исследуются особенности математических моделей таких состояний в виде полей характеристик (линий скольжения). Рассмотрены случаи полной и неполной реализации контактного упрочнения менее прочной части и контактного разупрочнения более прочной части соединения. Впервые показано, что линии разрыва напряжений могут располагаться в менее прочной части соединения, а зоны пластического течения более прочной части могут находиться внутри соединения.
This paper concerns pseudo-classical knots in the non-orientable manifold Σˆ = Σ × [0, 1], where Σ is a non-orientable surface and a knot K ⊂ Σˆ is called pseudo-classical if Kis orientation-preserving path in Σˆ. For this kind of knot we introduce an invariant ∆that is an analogue of Turaev comultiplication for knots in a thickened orientable surface. As its classical prototype, ∆ takes value in a polynomial algebra generated by homotopy classes of non-contractible loops on Σ, however, as a ground ring we use some subring of C instead of Z. Then we define a few homotopy, homology and polynomial invariants, which are consequences of ∆, including an analogue of the affine index polynomial.
We consider several new classes of metrically ρ-almost periodic type functions F: I ×X →Y, where ∅ = I ⊆ Rn, X is an arbitrary non-empty set and Y is a sequentially completelocally convex space. We briefly explain how the introduced notion can be useful in the study of qualitative analysis of solutions for some classes of the abstract Volterra integro-differential inclusions in locally convex spaces.
We establish some generalizations of integral inequalities for Hardy-type operator and its conjugate via Laplace transform. Moreover, some new estimates with Laplace transform are deduced.
The issues of the unique solvability of a Cauchy type problem for a quasilinear equation in a Banach space with several minor fractional derivatives in the nonlinear part and with a linear operator generating an analytical resolving family of operators of a linear homogeneous equation are investigated. Using the Banach contraction mapping theorem, the existence and uniqueness of local and global solutions in specially constructed H¨older type spaces is proved. Abstract results are used for the study of an initial boundary value problem for a modified time-fractional order system of the phase field equations.
Рассматривается гамильтониан Ландау HB + V, действующий в L2(R2) и возмущённый периодическим электрическим потенциалом V. Предполагается, что магнитный поток η = (2π)-1Bv(K) однородного магнитного поля B > 0 является рациональным числом, где v(K) - площадь элементарной ячейки K решётки периодов Λ потенциалаΛΛlocV. Определяются семейства банаховых пространств Ln (R2; R), которые (как линейные пространства) являются линейными подпространствами пространств Соболева Hn(R2; R), n ∈ N∪{0}, периодических с решёткой периодов Λ функций из Hn (R2; R)Λи которые содержат плотные Gδ-множества O ⊆ Ln (R2; R), такие, что для любого ΛΛэлектрического потенциала V ∈ O и любого однородного магнитного поля с потоком 0 < η ∈ Q спектр оператора HB + V абсолютно непрерывен. В частности, в качестве пространств Ln (R2; R) можно выбирать пространства Hs (R2; R), s ∈ [n, n+1). Такжепри заданных решётке периодов Λ ⊂ R2 и однородном магнитном поле B > 0 приве-Λ дены условия на коэффициенты Фурье периодического электрического потенциала V ∈ Hn(R2; R), n ∈ N ∪ {0}, при выполнении которых и при η ∈ Q спектр оператора HB + V абсолютно непрерывен.
Изучается дифференциальное уравнение математической модели вертикального маятника, в правой части которого содержатся члены с линейным запаздыванием. Исследуемое уравнение имеет нейтральный тип. Такие уравнения встречаются в задачах механики, биологии, в экономике. Исследуется задача стабилизации данной управляемой математической модели. Система содержит два линейных запаздывания. Поскольку эти запаздывания возрастают при t → ∞, стабилизация производится на бесконечном промежутке времени t. Успокоение системы, не содержащей вправой части нейтральных членов, производится с использованием алгоритма стабилизации, предложенного для обыкновенных дифференциальных уравнений. Для дальнейшей стабилизации используется алгоритм стабилизации разностных систем. Приведён конкретный числовой пример и осуществлён поиск численных решений уравнений, получающихся в процессе стабилизации. Для решения уравнений типа Ляпунова и численного подсчёта решений использовался пакет прикладных задач MatLab.
Рассматривается задача Коши для квазилинейного уравнения теплопроводности с переменным коэффициентом теплоёмкости и коэффициентом теплопроводности, пропорциональным температуре. Исходное дифференциальное уравнение с начальными данными приводится к некоторому интегродифференциальному уравнению для образа Фурье искомого решения с начальными данными на положительной полуоси. Интегрирование в полученном уравнении для Фурье-образа решения исходной дифференциальной задачи производится по первому квадранту плоскости независимых переменных. Билинейный интегральный оператор в полученном интегродифференциальном уравнении имеет в качестве ядра функцию от времени и двух неотрицательных переменных интегрирования. Ядро явным образом выражено через переменный коэффициент теплоёмкости исходного дифференциального уравнения.
Доказано существование единственного решения для нелокальных задач сопряжений в прямоугольной области для уравнения в частных производных 3-го порядка, когда при y > 0 уравнение характеристик имеет 3 кратных корня, а при y < 0 имеет 1 простой и 2 кратных корня. С помощью функции Грина и метода интегральных уравнений решение задач эквивалентным образом сводится к решению краевой задачи для следа искомой функции при y = 0, а затем - к решению интегрального уравнения Фредгольма 2-го рода, разрешимость которого доказывается методом последовательных приближений. Решение задачи при y > 0 строится методом функции Грина, а при y < 0 - сведением задачи к двумерному интегральному уравнению Вольтерра 2-го рода.
Издательство
- Издательство
- ЧЕЛГУ
- Регион
- Россия, Челябинск
- Почтовый адрес
- 454001, Челябинская обл., г. Челябинск, ул. Братьев Кашириных, д.129
- Юр. адрес
- 454001, Челябинская обл, г Челябинск, Калининский р-н, ул Братьев Кашириных, д 129
- ФИО
- Таскаев Сергей Валерьевич (РЕКТОР)
- E-mail адрес
- rector@csu.ru
- Контактный телефон
- +7 (351) 7419767
- Сайт
- https://www.csu.ru/