COMPARATIVE ANALYSIS OF REAL-TIME GESTURE RECOGNITION METHODS BASED ON MEDIAPIPE, OPENCV, AND YOLOV8
ID елемента: 22412
2026/05/05
Цитування
eNUPPIR (). COMPARATIVE ANALYSIS OF REAL-TIME GESTURE RECOGNITION METHODS BASED ON MEDIAPIPE, OPENCV, AND YOLOV8. https://enuppir.politeh.duckdns.org/item/22412
eNUPPIR. "COMPARATIVE ANALYSIS OF REAL-TIME GESTURE RECOGNITION METHODS BASED ON MEDIAPIPE, OPENCV, AND YOLOV8." Web. . <https://enuppir.politeh.duckdns.org/item/22412>.
eNUPPIR. "COMPARATIVE ANALYSIS OF REAL-TIME GESTURE RECOGNITION METHODS BASED ON MEDIAPIPE, OPENCV, AND YOLOV8." Accessed . https://enuppir.politeh.duckdns.org/item/22412.
Скопійовано в буфер обміну
Властивості
Назва
Англійська
COMPARATIVE ANALYSIS OF REAL-TIME GESTURE RECOGNITION METHODS BASED ON MEDIAPIPE, OPENCV, AND YOLOV8
Російська
.
Українська
ПОРІВНЯЛЬНИЙ АНАЛІЗ МЕТОДІВ РЕАЛЬНОГО ЧАСУ ДЛЯ РОЗПІЗНАВАННЯ ЖЕСТІВ НА ОСНОВІ MEDIAPIPE, OPENCV ТА YOLOV8
Опис
Англійська
The subject of the article is real-time gesture recognition methods based on computer vision, designed for integration into human-computer interaction (HCI) systems, particularly for device control via a webcam. The purpose of the work is a comparative analysis of the efficiency of three modern methods MediaPipe, OpenCV, and YOLOv8 by evaluating their performance using key metrics (FPS and Detection Rate) for detecting basic gestures. The article solves the following tasks: identifying the impact of external factors (lighting, background) on gesture recognition, implementing algorithms for three basic gestures (open palm, index finger up and down), conducting experimental testing and modeling in the Python environment. The following methods are used: computer vision and image processing (in particular, segmentation, keypoint tracking, and object detection); machine learning based on CNN (LeNet, YOLO); analysis of datasets and performance metrics (precision, recall, mAP); simulation modeling in real conditions using the libraries mediapipe, opencv-python, and ultralytics. The following results were obtained: a comparative analysis of the methods was conducted, where MediaPipe provided the highest accuracy (95% Detection Rate), OpenCV—the maximum speed (50.7 FPS), and YOLOv8—a balance for limited resources (73% Detection Rate); recommendations for hybrid approaches to optimization were proposed. Conclusions: The developed comparative analysis of real-time gesture recognition methods demonstrates that MediaPipe effectively eliminates interference from variable lighting and background, achieving a stable accuracy of 95%, while OpenCV optimizes processing speed to 50.7 FPS. Modeling was performed in Python with visualization of the results.
Українська
Предметом дослідження в статті є методи розпізнавання жестів у реальному часі на основі комп'ютерного зору, призначені для інтеграції у системи взаємодії людини з комп'ютером (HCI), зокрема для керування пристроями через веб-камеру. Метою роботи є порівняльний аналіз ефективності трьох сучасних методів – MediaPipe, OpenCV та YOLOv8 – шляхом оцінки їхньої продуктивності за ключовими метриками (FPS та Detection Rate) при виявленні базових жестів. У статті вирішуються такі завдання: ідентифікація впливу зовнішніх факторів (освітлення, фон) на розпізнавання жестів, реалізація алгоритмів для трьох базових жестів (відкрита долоня, вказівний палець вгору та вниз), проведення експериментального тестування та моделювання в середовищі Python. Використовуються такі методи: комп'ютерний зір та обробка зображень (зокрема, сегментація, відстеження ключових точок та об'єктний детекшн); машинне навчання на основі CNN (LeNet, YOLO); аналіз датасетів і метрик продуктивності (precision, recall, mAP); імітаційне моделювання в реальних умовах за допомогою бібліотек mediapipe, opencv-python та ultralytics. Отримано такі результати: проведено порівняльний аналіз методів, де MediaPipe забезпечив найвищу точність (95% Detection Rate), OpenCV – максимальну швидкість (50.7 FPS), а YOLOv8 – баланс для обмежених ресурсів (73% Detection Rate); запропоновано рекомендації щодо гібридних підходів для оптимізації. Висновки: Розроблений порівняльний аналіз методів розпізнавання жестів у реальному часі демонструє, що MediaPipe ефективно усуває перешкоди від мінливого освітлення та фону, досягаючи стабільної точності 95%, тоді як OpenCV оптимізує швидкість обробки до 50.7 FPS. Виконано моделювання в Python з візуалізацією результатів.
Автор
Українська
Yeroshenko, Olha
Українська
Tsipkovskyi, Vadym
Тематика
Англійська
gesture recognition
Англійська
computer vision
Англійська
MediaPipe
Англійська
OpenCV
Англійська
YOLOv8
Англійська
FPS
Англійська
Detection Rate
Російська
13
Українська
розпізнавання жестів
Українська
комп'ютерний зір
Українська
MediaPipe
Українська
OpenCV
Українська
YOLOv8
Українська
FPS
Українська
Detection Rate
Видавництво
Українська
Національний університет «Полтавська політехніка імені Юрія Кондратюка»
Тип
info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Українська
Рецензована Стаття
Формат
application/pdf
Ідентифікатор
https://journals.nupp.edu.ua/sunz/article/view/4104
10.26906/SUNZ.2025.4.062
Джерело
Англійська
Control, Navigation and Communication Systems. Academic Journal; Vol. 4 No. 82 (2025): Control, Navigation and Communication Systems; 62-65
Російська
Системы управления, навигации и связи. Сборник научных трудов; Том 4 № 82 (2025): Системи управління, навігації та зв'язку; 62-65
Українська
Системи управління, навігації та зв’язку. Збірник наукових праць; Том 4 № 82 (2025): Системи управління, навігації та зв'язку; 62-65
2073-7394
10.26906/SUNZ.2025.4
2025. №4 (82)
Мова
uk
Відношення
https://journals.nupp.edu.ua/sunz/article/view/4104/3434
Права
Українська
Авторське право (c) 2025 Olha Yeroshenko, Vadym Tsipkovskyi
Українська
http://creativecommons.org/licenses/by-nc/4.0
Інформація про метадані
Створено
2026-5-5 11:56
Остання зміна
2026-5-5 11:56
ID елемента
#22412