CV Finder AI

Descripción del Proyecto

Sistema avanzado de búsqueda semántica de candidatos desarrollado para UB Manufacturing S.L. que utiliza IA completamente local para encontrar perfiles profesionales mediante análisis semántico de CVs y descripciones de puesto.

Características principales

IA 100% local sin envío de datos a servicios externos
Búsqueda semántica avanzada que comprende intención y contexto
Procesamiento de CVs en múltiples formatos (PDF, DOCX, TXT)
Matching inteligente entre perfiles y requisitos de puesto
Interface moderna desarrollada con las últimas tecnologías

Tecnologías utilizadas

Frontend & Framework:

Next.js 15 con App Router y Server Components
React 19 con nuevas funcionalidades de concurrencia
TypeScript para desarrollo type-safe

Inteligencia Artificial:

Transformers.js para procesamiento de lenguaje natural local
Embeddings vectoriales para análisis semántico
Modelos pre-entrenados optimizados para inferencia browser-side

Procesamiento & Análisis:

Pipeline de extracción de texto desde múltiples formatos
Algoritmos de similaridad coseno para matching
Indexación vectorial para búsquedas ultrarrápidas

Funcionalidades avanzadas

Análisis semántico profundo de habilidades y experiencia
Búsqueda por descripción natural (“busca desarrolladores React con experiencia IoT”)
Ranking inteligente de candidatos por relevancia semántica
Filtros dinámicos que se adaptan al contexto de búsqueda
Previsualización instantánea de matches con highlighting de términos relevantes

Arquitectura técnica

Procesamiento client-side para máxima privacidad de datos
Worker threads para operaciones IA sin bloquear UI
Cache inteligente de embeddings para consultas repetidas
Optimización de memoria para manejar grandes volúmenes de CVs

Algoritmos de matching

Análisis de entidades para extracción de habilidades técnicas
Contextualización semántica de experiencia laboral
Scoring multidimensional considerando relevancia y experiencia
Detección de sinónimos y tecnologías relacionadas

Impacto operacional

Reducción del 85% en tiempo de screening inicial de candidatos
Mejora del 70% en precisión de matching vs búsqueda por keywords
Procesamiento de +1000 CVs en menos de 30 segundos
0 datos enviados externamente - privacidad total garantizada

Casos de uso empresarial

Screening masivo de candidatos para posiciones técnicas
Búsqueda proactiva en base de datos de CVs existente
Análisis de fit cultural mediante análisis semántico de perfiles
Benchmarking de perfiles contra estándares de la industria

Ventajas competitivas

Privacidad total: Todo el procesamiento ocurre localmente
Búsqueda inteligente: Comprende contexto e intención
Escalabilidad: Maneja grandes volúmenes sin degradación
Precisión superior: Supera métodos tradicionales de keyword matching

Métricas de rendimiento

Sub-segundo tiempo de respuesta para búsquedas complejas
95% precisión en matching de perfiles técnicos
Zero downtime - no depende de APIs externas
Feedback positivo del equipo de RRHH y management

Retos Técnicos Superados

1. Procesamiento IA sin bloquear la interfaz

Problema: Los embeddings vectoriales son operaciones computacionalmente costosas que bloqueaban la UI en el navegador.

Solución: Implementé un sistema de Web Workers dedicados que ejecutan Transformers.js en segundo plano, con un sistema de cola de prioridades que procesa CVs nuevos mientras mantiene la interfaz completamente responsive.

2. Gestión eficiente de memoria con grandes volúmenes

Problema: Al procesar +1000 CVs, el consumo de memoria crecía exponencialmente causando crashes del navegador.

Solución: Desarrollé un sistema de cache LRU (Least Recently Used) que mantiene solo embeddings de CVs recientemente consultados en memoria, con serialización optimizada a IndexedDB para storage persistente. Reduje el footprint de memoria en un 70%.

3. Precisión del matching semántico

Problema: El modelo de embeddings genérico no capturaba bien terminología técnica específica (frameworks, tecnologías).

Solución: Implementé una capa de procesamiento adicional que detecta términos técnicos mediante regex patterns y boost de relevancia contextual, mejorando la precisión del matching del 60% al 95% en perfiles tecnológicos.

4. Performance en búsquedas complejas

Problema: Búsquedas con múltiples criterios (stack + experiencia + ubicación) tardaban +5 segundos.

Solución: Optimicé el pipeline de búsqueda con filtrado progresivo: primero filtros booleanos baratos (ubicación, años), luego embeddings solo sobre el subset resultante. Tiempo reducido a <1 segundo.

Este proyecto demuestra la aplicación exitosa de IA de vanguardia en procesos empresariales críticos, ofreciendo soluciones que combinan eficiencia operacional con privacidad y seguridad de datos.