ОПРЕДЕЛЕНИЕ И АНАЛИЗ ВЫРАЖЕНИЙ ЛИЦА НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ПОМОЩЬЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ОПРЕДЕЛЕНИЕ И АНАЛИЗ ВЫРАЖЕНИЙ ЛИЦА НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ПОМОЩЬЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

##article.authors##

  • Гофуржонов М.Р.
  • Абдуллаев А.А.

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.5281/zenodo.19679614

##article.subject##:

распознавание эмоций, выражения лица, глубокое обучение, сверточные нейронные сети, компьютерное зрение, FER2013, Vision Transformer

##article.abstract##

В статье рассматриваются методы автоматического определения и классификации выражений лица
на цифровых изображениях с применением глубокого обучения. Проведен сравнительный анализ современных
архитектур нейронных сетей — CNN, ResNet, MobileNet, EfficientNet и Vision Transformer — для задачи
распознавания семи базовых эмоций. Описана разработанная система, включающая детектирование лица,
нормализацию, извлечение признаков и классификацию. На датасете FER2013 достигнута точность 78,2 %, что
превышает базовые показатели на 4,7 процентного пункта. Обсуждаются перспективы применения технологии в
медицине, безопасности и взаимодействии человека с компьютером

Биографии авторов

Гофуржонов М.Р.

Ташкентский университет
информационных технологий
им. Мухаммада ал-Хоразмий
Ассистент кафедры “Искусственный интеллект”

Абдуллаев А.А.


Ташкентский университет
информационных технологий им.
Мухаммада ал-Хоразмий
Студент 4-го курса, факультет
Программной инженерии

Библиографические ссылки

Ekman P., Friesen W. V. Facial Action Coding System: A Technique for the Measurement of Facial Movement. — Palo

Alto: Consulting Psychologists Press, 1978. — 228 p.

LeCun Y., Bengio Y., Hinton G. Deep learning // Nature. — 2015. — Vol. 521. — P. 436–444. DOI: 10.1038/nature14539

He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition // Proc. IEEE CVPR. — 2016. — P.

–778. DOI: 10.1109/CVPR.2016.90

Dosovitskiy A. et al. An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale // ICLR 2021. —

arXiv:2010.11929

Tan M., Le Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks // ICML 2019. —

arXiv:1905.11946

Goodfellow I. J. et al. Challenges in Representation Learning: A Report on Three Machine Learning Contests // Neural

Networks. — 2015. — Vol. 64. — P. 59–63.

Zhang K. et al. Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks // IEEE Signal

Processing Letters. — 2016. — Vol. 23, No. 10. — P. 1499–1503.

Li S., Deng W. Deep Facial Expression Recognition: A Survey // IEEE TAFFC. — 2022. — Vol. 13, No. 3. — P. 1195–

DOI: 10.1109/TAFFC.2020.2981446

Sandler M. et al. MobileNetV2: Inverted Residuals and Linear Bottlenecks // Proc. IEEE CVPR. — 2018. — P. 4510–

Mollahosseini A., Hasani B., Mahoor M. H. AffectNet: A Database for Facial Expression, Valence, and Arousal Computing

in the Wild // IEEE TAFFC. — 2019. — Vol. 10, No. 1. — P. 18–31.

Загрузки

##submissions.published##

2026-03-01

##issue.issue##

##section.section##

Articles
Loading...