Volver a proyectos
Completado

CV Finder AI

Sistema de búsqueda semántica de candidatos con IA local y embeddings vectoriales

Descripción del Proyecto

Sistema avanzado de búsqueda semántica de candidatos desarrollado para UB Manufacturing S.L. que utiliza IA completamente local para encontrar perfiles profesionales mediante análisis semántico de CVs y descripciones de puesto.

Características principales

  • IA 100% local sin envío de datos a servicios externos
  • Búsqueda semántica avanzada que comprende intención y contexto
  • Procesamiento de CVs en múltiples formatos (PDF, DOCX, TXT)
  • Matching inteligente entre perfiles y requisitos de puesto
  • Interface moderna desarrollada con las últimas tecnologías

Tecnologías utilizadas

Frontend & Framework:

  • Next.js 15 con App Router y Server Components
  • React 19 con nuevas funcionalidades de concurrencia
  • TypeScript para desarrollo type-safe

Inteligencia Artificial:

  • Transformers.js para procesamiento de lenguaje natural local
  • Embeddings vectoriales para análisis semántico
  • Modelos pre-entrenados optimizados para inferencia browser-side

Procesamiento & Análisis:

  • Pipeline de extracción de texto desde múltiples formatos
  • Algoritmos de similaridad coseno para matching
  • Indexación vectorial para búsquedas ultrarrápidas

Funcionalidades avanzadas

  • Análisis semántico profundo de habilidades y experiencia
  • Búsqueda por descripción natural (“busca desarrolladores React con experiencia IoT”)
  • Ranking inteligente de candidatos por relevancia semántica
  • Filtros dinámicos que se adaptan al contexto de búsqueda
  • Previsualización instantánea de matches con highlighting de términos relevantes

Arquitectura técnica

  • Procesamiento client-side para máxima privacidad de datos
  • Worker threads para operaciones IA sin bloquear UI
  • Cache inteligente de embeddings para consultas repetidas
  • Optimización de memoria para manejar grandes volúmenes de CVs

Algoritmos de matching

  • Análisis de entidades para extracción de habilidades técnicas
  • Contextualización semántica de experiencia laboral
  • Scoring multidimensional considerando relevancia y experiencia
  • Detección de sinónimos y tecnologías relacionadas

Impacto operacional

  • Reducción del 85% en tiempo de screening inicial de candidatos
  • Mejora del 70% en precisión de matching vs búsqueda por keywords
  • Procesamiento de +1000 CVs en menos de 30 segundos
  • 0 datos enviados externamente - privacidad total garantizada

Casos de uso empresarial

  • Screening masivo de candidatos para posiciones técnicas
  • Búsqueda proactiva en base de datos de CVs existente
  • Análisis de fit cultural mediante análisis semántico de perfiles
  • Benchmarking de perfiles contra estándares de la industria

Ventajas competitivas

  • Privacidad total: Todo el procesamiento ocurre localmente
  • Búsqueda inteligente: Comprende contexto e intención
  • Escalabilidad: Maneja grandes volúmenes sin degradación
  • Precisión superior: Supera métodos tradicionales de keyword matching

Métricas de rendimiento

  • Sub-segundo tiempo de respuesta para búsquedas complejas
  • 95% precisión en matching de perfiles técnicos
  • Zero downtime - no depende de APIs externas
  • Feedback positivo del equipo de RRHH y management

Retos Técnicos Superados

1. Procesamiento IA sin bloquear la interfaz

Problema: Los embeddings vectoriales son operaciones computacionalmente costosas que bloqueaban la UI en el navegador.

Solución: Implementé un sistema de Web Workers dedicados que ejecutan Transformers.js en segundo plano, con un sistema de cola de prioridades que procesa CVs nuevos mientras mantiene la interfaz completamente responsive.

2. Gestión eficiente de memoria con grandes volúmenes

Problema: Al procesar +1000 CVs, el consumo de memoria crecía exponencialmente causando crashes del navegador.

Solución: Desarrollé un sistema de cache LRU (Least Recently Used) que mantiene solo embeddings de CVs recientemente consultados en memoria, con serialización optimizada a IndexedDB para storage persistente. Reduje el footprint de memoria en un 70%.

3. Precisión del matching semántico

Problema: El modelo de embeddings genérico no capturaba bien terminología técnica específica (frameworks, tecnologías).

Solución: Implementé una capa de procesamiento adicional que detecta términos técnicos mediante regex patterns y boost de relevancia contextual, mejorando la precisión del matching del 60% al 95% en perfiles tecnológicos.

4. Performance en búsquedas complejas

Problema: Búsquedas con múltiples criterios (stack + experiencia + ubicación) tardaban +5 segundos.

Solución: Optimicé el pipeline de búsqueda con filtrado progresivo: primero filtros booleanos baratos (ubicación, años), luego embeddings solo sobre el subset resultante. Tiempo reducido a <1 segundo.


Este proyecto demuestra la aplicación exitosa de IA de vanguardia en procesos empresariales críticos, ofreciendo soluciones que combinan eficiencia operacional con privacidad y seguridad de datos.

Explorar más proyectos

Ver todos