CV Finder AI
Sistema de búsqueda semántica de candidatos con IA local y embeddings vectoriales
Descripción del Proyecto
Sistema avanzado de búsqueda semántica de candidatos desarrollado para UB Manufacturing S.L. que utiliza IA completamente local para encontrar perfiles profesionales mediante análisis semántico de CVs y descripciones de puesto.
Características principales
- IA 100% local sin envío de datos a servicios externos
- Búsqueda semántica avanzada que comprende intención y contexto
- Procesamiento de CVs en múltiples formatos (PDF, DOCX, TXT)
- Matching inteligente entre perfiles y requisitos de puesto
- Interface moderna desarrollada con las últimas tecnologías
Tecnologías utilizadas
Frontend & Framework:
- Next.js 15 con App Router y Server Components
- React 19 con nuevas funcionalidades de concurrencia
- TypeScript para desarrollo type-safe
Inteligencia Artificial:
- Transformers.js para procesamiento de lenguaje natural local
- Embeddings vectoriales para análisis semántico
- Modelos pre-entrenados optimizados para inferencia browser-side
Procesamiento & Análisis:
- Pipeline de extracción de texto desde múltiples formatos
- Algoritmos de similaridad coseno para matching
- Indexación vectorial para búsquedas ultrarrápidas
Funcionalidades avanzadas
- Análisis semántico profundo de habilidades y experiencia
- Búsqueda por descripción natural (“busca desarrolladores React con experiencia IoT”)
- Ranking inteligente de candidatos por relevancia semántica
- Filtros dinámicos que se adaptan al contexto de búsqueda
- Previsualización instantánea de matches con highlighting de términos relevantes
Arquitectura técnica
- Procesamiento client-side para máxima privacidad de datos
- Worker threads para operaciones IA sin bloquear UI
- Cache inteligente de embeddings para consultas repetidas
- Optimización de memoria para manejar grandes volúmenes de CVs
Algoritmos de matching
- Análisis de entidades para extracción de habilidades técnicas
- Contextualización semántica de experiencia laboral
- Scoring multidimensional considerando relevancia y experiencia
- Detección de sinónimos y tecnologías relacionadas
Impacto operacional
- Reducción del 85% en tiempo de screening inicial de candidatos
- Mejora del 70% en precisión de matching vs búsqueda por keywords
- Procesamiento de +1000 CVs en menos de 30 segundos
- 0 datos enviados externamente - privacidad total garantizada
Casos de uso empresarial
- Screening masivo de candidatos para posiciones técnicas
- Búsqueda proactiva en base de datos de CVs existente
- Análisis de fit cultural mediante análisis semántico de perfiles
- Benchmarking de perfiles contra estándares de la industria
Ventajas competitivas
- Privacidad total: Todo el procesamiento ocurre localmente
- Búsqueda inteligente: Comprende contexto e intención
- Escalabilidad: Maneja grandes volúmenes sin degradación
- Precisión superior: Supera métodos tradicionales de keyword matching
Métricas de rendimiento
- Sub-segundo tiempo de respuesta para búsquedas complejas
- 95% precisión en matching de perfiles técnicos
- Zero downtime - no depende de APIs externas
- Feedback positivo del equipo de RRHH y management
Retos Técnicos Superados
1. Procesamiento IA sin bloquear la interfaz
Problema: Los embeddings vectoriales son operaciones computacionalmente costosas que bloqueaban la UI en el navegador.
Solución: Implementé un sistema de Web Workers dedicados que ejecutan Transformers.js en segundo plano, con un sistema de cola de prioridades que procesa CVs nuevos mientras mantiene la interfaz completamente responsive.
2. Gestión eficiente de memoria con grandes volúmenes
Problema: Al procesar +1000 CVs, el consumo de memoria crecía exponencialmente causando crashes del navegador.
Solución: Desarrollé un sistema de cache LRU (Least Recently Used) que mantiene solo embeddings de CVs recientemente consultados en memoria, con serialización optimizada a IndexedDB para storage persistente. Reduje el footprint de memoria en un 70%.
3. Precisión del matching semántico
Problema: El modelo de embeddings genérico no capturaba bien terminología técnica específica (frameworks, tecnologías).
Solución: Implementé una capa de procesamiento adicional que detecta términos técnicos mediante regex patterns y boost de relevancia contextual, mejorando la precisión del matching del 60% al 95% en perfiles tecnológicos.
4. Performance en búsquedas complejas
Problema: Búsquedas con múltiples criterios (stack + experiencia + ubicación) tardaban +5 segundos.
Solución: Optimicé el pipeline de búsqueda con filtrado progresivo: primero filtros booleanos baratos (ubicación, años), luego embeddings solo sobre el subset resultante. Tiempo reducido a <1 segundo.
Este proyecto demuestra la aplicación exitosa de IA de vanguardia en procesos empresariales críticos, ofreciendo soluciones que combinan eficiencia operacional con privacidad y seguridad de datos.