ОПРЕДЕЛЕНИЕ И АНАЛИЗ ВЫРАЖЕНИЙ ЛИЦА НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ПОМОЩЬЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.5281/zenodo.19679614##article.subject##:
распознавание эмоций, выражения лица, глубокое обучение, сверточные нейронные сети, компьютерное зрение, FER2013, Vision Transformer##article.abstract##
В статье рассматриваются методы автоматического определения и классификации выражений лица
на цифровых изображениях с применением глубокого обучения. Проведен сравнительный анализ современных
архитектур нейронных сетей — CNN, ResNet, MobileNet, EfficientNet и Vision Transformer — для задачи
распознавания семи базовых эмоций. Описана разработанная система, включающая детектирование лица,
нормализацию, извлечение признаков и классификацию. На датасете FER2013 достигнута точность 78,2 %, что
превышает базовые показатели на 4,7 процентного пункта. Обсуждаются перспективы применения технологии в
медицине, безопасности и взаимодействии человека с компьютером
Библиографические ссылки
Ekman P., Friesen W. V. Facial Action Coding System: A Technique for the Measurement of Facial Movement. — Palo
Alto: Consulting Psychologists Press, 1978. — 228 p.
LeCun Y., Bengio Y., Hinton G. Deep learning // Nature. — 2015. — Vol. 521. — P. 436–444. DOI: 10.1038/nature14539
He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition // Proc. IEEE CVPR. — 2016. — P.
–778. DOI: 10.1109/CVPR.2016.90
Dosovitskiy A. et al. An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale // ICLR 2021. —
arXiv:2010.11929
Tan M., Le Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks // ICML 2019. —
arXiv:1905.11946
Goodfellow I. J. et al. Challenges in Representation Learning: A Report on Three Machine Learning Contests // Neural
Networks. — 2015. — Vol. 64. — P. 59–63.
Zhang K. et al. Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks // IEEE Signal
Processing Letters. — 2016. — Vol. 23, No. 10. — P. 1499–1503.
Li S., Deng W. Deep Facial Expression Recognition: A Survey // IEEE TAFFC. — 2022. — Vol. 13, No. 3. — P. 1195–
DOI: 10.1109/TAFFC.2020.2981446
Sandler M. et al. MobileNetV2: Inverted Residuals and Linear Bottlenecks // Proc. IEEE CVPR. — 2018. — P. 4510–
Mollahosseini A., Hasani B., Mahoor M. H. AffectNet: A Database for Facial Expression, Valence, and Arousal Computing
in the Wild // IEEE TAFFC. — 2019. — Vol. 10, No. 1. — P. 18–31.
Загрузки
##submissions.published##
##issue.issue##
##section.section##
Лицензия
Copyright (c) 2026 MUHANDISLIK VA IQTISODIYOT

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.