RAG
Retrieval-Augmented Generation: técnica que combina búsqueda de información en una base de conocimiento con generación de texto para producir respuestas precisas y verificables.
Qué es
RAG (Retrieval-Augmented Generation) es una arquitectura de sistema de IA que antes de generar una respuesta, busca información relevante en una base de conocimiento y la incluye en el contexto del modelo.
Por qué importa
Resuelve dos problemas fundamentales de los LLMs:
- El conocimiento del modelo está congelado en el tiempo (no sabe nada de después de su entrenamiento)
- El modelo no tiene acceso a tu información privada o específica del dominio
Con RAG, el modelo puede responder con información actualizada y específica sin necesidad de reentrenamiento.
Cómo funciona
- Tus documentos se indexan como embeddings en una vector database
- Cuando llega una pregunta, se convierte también en un embedding
- Se recuperan los fragmentos del documento más similares a la pregunta
- El modelo genera la respuesta usando esos fragmentos como contexto
Cuándo usar RAG
- Cuando necesitas respuestas basadas en documentación propia o privada
- Cuando la información cambia frecuentemente
- Cuando necesitas que las respuestas sean verificables con fuentes concretas
- Para reducir alucinaciones en dominios especializados
Componentes técnicos
- Documentos fuente (PDFs, webs, bases de datos)
- Modelo de embeddings
- Vector database
- Retriever (lógica de búsqueda)
- LLM (generación final)
Términos relacionados
Pon en práctica lo que has aprendido
Tenemos una herramienta gratuita directamente relacionada con este concepto.
Checklist de RAG →Artículo relacionado
→ Qué es RAGTérminos relacionados
Embeddings
Representaciones numéricas de texto que capturan su significado semántico. Son la base de la búsqueda semántica, RAG y muchas aplicaciones de IA.
Semantic Search
Búsqueda por significado en lugar de por palabras exactas. Usa embeddings para encontrar contenido relevante aunque no coincidan las palabras clave.
Vector Database
Base de datos especializada en almacenar embeddings y buscar por similitud semántica. Componente central de los sistemas RAG.
Chunking
Proceso de dividir documentos largos en fragmentos más pequeños para indexarlos en una base de datos vectorial en sistemas RAG.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.