Concepto Principal
Para funcionar sobre datos privados, Amazon Q Business usa Data Connectors para recuperar información (leer) y Plugins para ejecutar acciones en sistemas externos (escribir/actuar).
Aspectos Clave
- Data Connectors (Fully Managed RAG): Conectan con más de 40 fuentes (Amazon S3, RDS, Microsoft 365, SharePoint, etc.). Realizan un crawl para indexar los datos y permitir búsquedas.
- Plugins: Permiten interactuar con aplicaciones de terceros (Jira, ServiceNow, Zendesk, Salesforce) o usar APIs personalizadas.
El proceso de Crawling (Rastreo)
El Crawl es el proceso automático de exploración y sincronización de datos:
- Descubrimiento: El conector navega por la fuente de datos para encontrar documentos nuevos o actualizados.
- Indexación: Convierte el contenido encontrado en vectores (embeddings) para que el modelo pueda buscarlo semánticamente.
- Sincronización Programada: Se puede configurar para que el rastreo ocurra periódicamente (diario, semanal), manteniendo la información siempre fresca.
Ejemplo
- Uso de Conector: El asistente lee un PDF almacenado en Amazon S3 para responder a un empleado cuál es el deducible de su seguro médico.
- Uso de Plugin: El empleado le dice al asistente: “Crea un ticket en Jira reportando que la impresora del piso 3 no funciona”, y el asistente ejecuta la acción mediante el plugin de Jira.
Dominios del Examen
- Dominio 2: Fundamentals of GenAI (Task 2.3: Infraestructura de AWS).
- Dominio 3: Applications of Foundation Models (Task 3.3: Entender cómo los modelos interactúan con sistemas externos y RAG).
Concepto Principal
Los Business Connectors son componentes integrados de Amazon Q Business que permiten la ingesta y sincronización de datos desde diversas fuentes empresariales hacia un índice centralizado. Funcionan como el puente técnico que permite al asistente de IA realizar RAG (Retrieval-Augmented Generation) sobre información privada y específica de la organización.
Contexto
-
Data Freshness: Resuelve el problema de la fecha de corte (data cutoff) de los modelos.
-
Seguridad: Garantiza que la IA respete la gobernanza de datos y los privilegios de acceso existentes.
-
Eficiencia: Permite centralizar la búsqueda de información sin que el empleado tenga que saltar entre diferentes aplicaciones.
El proceso de Crawling (Rastreo)
El Crawl es el proceso automático de exploración y sincronización de datos:
- Descubrimiento: El conector navega por la fuente de datos para encontrar documentos nuevos o actualizados.
- Indexación: Convierte el contenido encontrado en vectores (embeddings) para que el modelo pueda buscarlo semánticamente.
- Sincronización Programada: Se puede configurar para que el rastreo ocurra periódicamente (diario, semanal), manteniendo la información siempre fresca.
Aspectos Clave
-
ACL Synchronization: Durante el crawling, el conector también sincroniza los permisos de usuario (Access Control Lists). Si un usuario no puede ver un archivo en SharePoint, Amazon Q Business no usará ese archivo para responderle.
-
Fuentes Soportadas: Incluye servicios de AWS (Amazon S3, Amazon RDS, Aurora, WorkDocs) y aplicaciones de terceros (Salesforce, Slack, Confluence, Microsoft 365).
-
RAG Automático: Los conectores eliminan la necesidad de programar un flujo de RAG manualmente; el servicio gestiona el ciclo completo.
Ejemplo
-
Escenario: Una empresa desea que sus empleados consulten políticas internas almacenadas en una instancia de SharePoint y manuales técnicos en Amazon S3.
-
Acción: Se configuran los conectores de Amazon Q Business para ambas fuentes; el sistema indexa el contenido y permite al empleado preguntar en lenguaje natural: “¿Cómo solicito vacaciones según la política de 2026?“.

Dominios del Examen
- Dominio 2: Fundamentos de GenAI (Identificación de tecnologías).
- Dominio 5: Seguridad, Cumplimiento y Gobernanza (Control de acceso y protección de datos).
Conceptos Relacionados
Links:
References