![🤖 Computer Vision & HCI Projects [Python]](/images/assets/computer-vision-projects.png)
🤖 Computer Vision & HCI Projects [Python]
- Ivan Luna
- Python , Backend-development , OpenCV , MediaPipe , Visión por Computadora , Aprendizaje Automático , Interacción Humano-Computadora , Detección en Tiempo Real , Reconocimiento de Gestos
- 24 Nov, 2024
Una colección de proyectos avanzados de visión por computadora enfocados en sistemas de monitoreo de seguridad e interacción humana en tiempo real.
Descripción General del Proyecto
Esta página muestra dos proyectos diferentes de visión por computadora que demuestran sistemas avanzados de interacción humana en tiempo real utilizando OpenCV y MediaPipe.
1. Reconocimiento de Gestos Multimodal
Un sistema integral de reconocimiento de gestos que procesa múltiples modalidades de entrada simultáneamente.
Características Principales:
- Seguimiento y clasificación de gestos manuales
- Análisis de expresiones faciales
- Detección de postura corporal
- Fusión de gestos multimodales
- Detección de movimientos rítmicos
Gestos Soportados:
- Gestos Manuales: Señal de paz, gesto OK
- Expresiones Faciales: Detección de sonrisa, seguimiento de cejas
- Posturas Corporales: Gesto de encogimiento de hombros
- Gestos Complejos: Pose de pensamiento (multimodal)
- Gestos Rítmicos: Detección de groove
2. Sistema de Detección de Somnolencia
Una aplicación enfocada en la seguridad que monitorea el estado de alerta del conductor mediante seguimiento ocular en tiempo real.
Características Principales:
- Seguimiento ocular en tiempo real usando MediaPipe Face Mesh
- Cálculo del Radio de Aspecto del Ojo (EAR) para detección de somnolencia
- Alertas visuales de somnolencia con umbrales configurables
- Panel de monitoreo en vivo
- Pantalla espejo para comodidad del usuario
Aspectos Técnicos Destacados:
- Detección de 6 puntos de referencia oculares
- Sistema de alertas basado en umbrales dinámicos
- Configuración de sensibilidad ajustable
- Optimización de rendimiento en tiempo real
Requisitos Técnicos
Requisitos Comunes:
- Python 3.9+
- OpenCV (cv2)
- MediaPipe
- NumPy
- SciPy
- Cámara web funcional
Opcional:
- GPU compatible con OpenCV (mejora el rendimiento)
Instalación y Configuración
Reconocimiento de Gestos:
git clone https://github.com/imprvhub/multimodal-gesture-recognition.git
cd multimodal-gesture-recognition
pip install -r requirements.txt
python gesture_recognition.py
Detección de Somnolencia:
git clone https://github.com/imprvhub/somnolence-detection.git
cd somnolence-detection
pip install -r requirements.txt
python somnolence_detection.py
Instrucciones de Uso
Sistema de Reconocimiento de Gestos:
- Se inicia en modo pantalla completa
- Controles:
- ‘q’ - Salir
- ‘r’ - Reiniciar calibración
- ‘esc’ - Salir de pantalla completa
- Muestra el estado del reconocimiento de gestos en tiempo real
Sistema de Detección de Somnolencia:
- La aplicación se inicia con la activación de la cámara web
- Presione ‘q’ para salir
- Los indicadores visuales muestran:
- Contornos oculares verdes
- Visualización del valor EAR
- Advertencias de somnolencia
Desarrollo Futuro
Reconocimiento de Gestos:
- Gestos multimodales adicionales
- Interfaz de entrenamiento de gestos personalizada
- Detección de secuencias de gestos
- Análisis de ritmo mejorado
Detección de Somnolencia:
- Implementación de alertas sonoras
- Capacidades de registro de datos
- Seguimiento de múltiples rostros
- Optimización para dispositivos móviles
Arquitectura Técnica
Ambos proyectos cuentan con:
- Procesamiento multi-hilo
- Optimización en tiempo real
- Patrones de diseño modulares
- Sistemas de umbrales adaptativos
- Gestión de estados
- Monitoreo de rendimiento
Aplicaciones de Investigación
Estos proyectos están diseñados para:
- Investigación académica
- Estudios de interacción humano-computadora
- Desarrollo de visión por computadora
- Prototipado de sistemas de seguridad
- Demostraciones técnicas
Licencia
Ambos proyectos están publicados bajo la Licencia MIT. Consulte los repositorios respectivos para términos detallados.
Desarrollado con OpenCV y MediaPipe