Cos'è il RAG (Retrieval Augmented Generation)?

È una tecnica che collega un modello linguistico ai tuoi documenti. Invece di rispondere a memoria, l'AI prima cerca i passaggi rilevanti nel tuo archivio, poi scrive la risposta basandosi su quelli e cita la fonte. Serve ad avere risposte ancorate ai dati aziendali, non al sapere generico di internet.

Che differenza c'è tra RAG e un chatbot generico come ChatGPT?

Un chatbot generico risponde con quello che ha imparato durante l'addestramento: non conosce i tuoi contratti, le tue procedure, i tuoi listini. Una knowledge base con RAG risponde sui tuoi documenti, indica da quale file arriva l'informazione e ammette quando la risposta non c'è. Cambia l'affidabilità su tutto ciò che è interno all'azienda.

Il RAG elimina le allucinazioni dell'AI?

Le riduce molto, non le azzera. Ancorando la risposta ai documenti recuperati e mostrando la fonte, è molto più difficile che l'AI inventi. Ma se l'archivio è disordinato o il recupero sbaglia documento, l'errore resta possibile. Per questo conta la qualità dei dati e tenere una persona che verifica le risposte critiche.

Servono molti documenti per costruire una knowledge base AI?

No. Conta più l'ordine della quantità. Si parte da un insieme ristretto e ben curato di documenti su un singolo caso d'uso (per esempio le procedure di un reparto), si verifica che le risposte reggano, poi si allarga. Partire caricando tutto l'archivio aziendale in una volta è il modo più rapido per ottenere risposte confuse.

RAG aziendale: come far rispondere l'AI sui documenti della tua impresa | Blog AI & Agenti

Il RAG (Retrieval Augmented Generation) è una tecnica che fa rispondere un'AI sui tuoi documenti invece che a memoria. Prima recupera i passaggi giusti dal tuo archivio, poi scrive la risposta basandosi su quelli e ti dice da dove l'ha presa. Detto in una riga: è la differenza tra un assistente che "sa più o meno come funziona" e uno che ha letto i tuoi contratti.

È la tecnologia dietro le knowledge base AI aziendali, e negli ultimi mesi è diventata una delle richieste più frequenti delle PMI. Qui proviamo a spiegarla senza gergo, con esempi concreti e dicendo anche quando non serve.

Perché un modello linguistico, da solo, non basta in azienda

ChatGPT e simili sanno tantissime cose generiche e zero cose tue. Non hanno mai visto il tuo listino 2026, la procedura di reso del tuo e-commerce, il capitolato di quel cliente. Se glielo chiedi, hai tre problemi.

Il primo è che inventa. Un modello linguistico genera testo plausibile, non testo vero: messo davanti a una domanda specifica su cui non sa nulla, spesso risponde lo stesso, con tono sicuro. È il fenomeno delle allucinazioni.

Il secondo è che è fermo nel tempo. Il modello conosce il mondo fino alla data del suo addestramento. Le tue procedure cambiate il mese scorso non esistono, per lui.

Il terzo è che non cita le fonti. Anche quando azzecca la risposta, non puoi verificarla. E in azienda una risposta che non puoi controllare vale poco, soprattutto su numeri, scadenze e clausole.

Il RAG nasce per risolvere esattamente questi tre punti.

Come funziona una knowledge base AI, passo per passo

Immagina di assumere una persona nuova e darle un raccoglitore con tutte le procedure. Quando arriva una domanda, lei non risponde a istinto: apre il raccoglitore, cerca la pagina giusta, legge e risponde citando quella pagina. Il RAG fa la stessa cosa, in automatico e in pochi secondi.

Sotto, il processo ha quattro fasi.

Ingestione. I documenti aziendali (PDF, Word, pagine di Confluence o Notion, email storiche, manuali) vengono raccolti e spezzati in pezzi più piccoli, dimensione paragrafo.
Indicizzazione. Ogni pezzo viene trasformato in una rappresentazione numerica che ne cattura il significato, l'embedding, e salvato in un archivio ricercabile per somiglianza di senso, non solo per parola esatta.
Recupero. Quando fai una domanda, il sistema cerca nell'archivio i pochi pezzi più pertinenti e li mette davanti al modello.
Generazione. Il modello scrive la risposta usando quei pezzi come base, e allega il riferimento al documento da cui arriva.

Il punto chiave è la fase 4: la risposta nasce dai tuoi documenti recuperati, non dalla memoria generica del modello. Ed è per questo che può citare la fonte e dire "non lo so" quando nell'archivio la risposta non c'è.

Dove ha senso davvero: esempi per PMI italiane

Meglio degli aggettivi, qualche caso che si vede in aziende vere.

Assistenza interna sulle procedure. Un'azienda con cento persone e decine di procedure operative. Invece di cercare nel gestionale documentale o chiedere al collega più anziano, chiunque scrive "come gestisco un reclamo su un prodotto in garanzia?" e ottiene la risposta con il link alla procedura ufficiale.
Ricerca dentro contratti e capitolati. Uno studio o un ufficio gare che lavora su centinaia di documenti lunghi. "In quali contratti attivi è prevista una penale per ritardo sopra il 5%?" è una domanda che a mano richiede ore. Con una knowledge base ben fatta diventa una ricerca da pochi secondi, con i riferimenti puntuali.
Onboarding di chi arriva. Le prime due settimane di una persona nuova sono fatte di domande ripetitive. Un assistente che risponde sui documenti interni toglie quel carico ai colleghi e accorcia i tempi.
Supporto clienti sui manuali di prodotto. Un'azienda che vende macchinari con manuali di trecento pagine. L'assistenza risponde più in fretta perché l'AI trova il paragrafo giusto e lo cita, pronta da verificare.

Lo schema è sempre lo stesso: tante informazioni sparse in documenti, persone che perdono tempo a cercarle, un costo che cresce col volume. Lì il RAG ha senso.

RAG, fine-tuning o chatbot generico: quale serve

Si fa confusione tra tre cose diverse.

Il chatbot generico va bene per domande generali, dove non servono i tuoi dati. Riscrivere un testo, spiegare un concetto, fare un riassunto di un articolo pubblico.

Il fine-tuning riaddestra un modello perché adotti un certo stile o gestisca un compito molto specifico e ripetitivo. È costoso, va rifatto quando i dati cambiano e non è il modo giusto per "fargli sapere" i tuoi documenti.

Il RAG è la scelta adatta quando il valore sta nel rispondere sui tuoi contenuti, che cambiano nel tempo e devono essere citabili. Per la stragrande maggioranza delle PMI che vogliono "un'AI che conosce i nostri documenti", la risposta è RAG, non fine-tuning.

Se il tuo obiettivo è far compiere azioni all'AI, e non solo rispondere, allora entri nel territorio degli agenti: ne abbiamo parlato in cos'è un agente AI. Spesso una knowledge base con RAG è proprio lo strumento che dà all'agente il contesto su cui ragionare.

Dati e privacy: dove restano i documenti

Per una PMI italiana questo punto pesa quanto la tecnologia. Caricare contratti, dati dei clienti o documenti sensibili su uno strumento pubblico e gratuito è rischioso: molti si riservano di usare quello che scrivi per allenare i loro modelli, e questo è incompatibile con il GDPR e con la riservatezza.

Una knowledge base seria tiene i documenti in un ambiente controllato, non li riusa per addestrare modelli di terzi e gestisce chi può vedere cosa. Le risposte rispettano i permessi: una persona non deve poter ottenere, tramite la chat, informazioni che non vedrebbe nei file originali.

Gli errori che rendono inutile una knowledge base AI

Il RAG non è magia, e i progetti che falliscono di solito sbagliano sempre le stesse cose.

Documenti sporchi. Versioni vecchie e nuove mescolate, scansioni illeggibili, duplicati. Se l'archivio è confuso, le risposte sono confuse. La pulizia dei dati è metà del lavoro.

Recupero mal tarato. Se il sistema spezza male i documenti o recupera i pezzi sbagliati, il modello risponde su materiale non pertinente. Sembra un problema dell'AI, è un problema di impostazione.

Nessuna citazione. Una risposta senza fonte non è verificabile, quindi in azienda non è affidabile. La citazione del documento non è un dettaglio estetico: è ciò che rende la risposta usabile.

Aspettarsi zero errori. Anche fatta bene, una knowledge base sbaglia ogni tanto. Va trattata come un assistente molto veloce di cui ti fidi, ma che controlli sui punti critici, non come un oracolo.

Come si misura se funziona

Tre numeri concreti, prima e dopo. Il tempo medio per trovare una risposta. Quante ricerche manuali nei documenti sono sparite. La qualità delle risposte su un campione verificato da una persona che conosce la materia. Se questi tre si muovono nella direzione giusta, lo strumento sta dando valore. Se non li misuri, stai solo tirando a indovinare.

In sintesi

Il RAG fa rispondere l'AI sui tuoi documenti, citando la fonte e ammettendo quando non sa. Risolve i tre limiti del modello generico in azienda: le allucinazioni, i dati fermi nel tempo, le risposte non verificabili. Non serve sempre e non è privo di errori, ma quando il problema è "abbiamo le informazioni, ma perdiamo tempo a cercarle", è lo strumento giusto.

È esattamente quello che progettiamo e consegniamo con la knowledge base AI interna: una soluzione costruita sui tuoi documenti, non un prototipo da demo. Se hai in mente un caso d'uso concreto e vuoi capire se regge sui tuoi dati reali, scrivici due righe: ti diciamo onestamente se vale la pena partire e da dove.