E06: Che cosa è un Large Language Model?
Un "modello linguistico di grandi dimensioni" ("Large Language Model") è un tipo di intelligenza artificiale specificamente progettato per comprendere e generare il linguaggio e il modo di parlare/scrivere umano.
Per spiegare questo concetto a un giurista, possiamo paragonare un LLM a una biblioteca vasta ma, allo stesso tempo, "dinamica", che non solo immagazzina la conoscenza, ma impara anche a dialogare con i suoi lettori, adattandosi alle loro richieste e a specifici contesti con notevole precisione.
Immaginiamo di entrare in una biblioteca antica, con un’immensa collezione di testi che abbracciano secoli, dalle opere omeriche ai più moderni trattati giuridici.
Un modello linguistico di grandi dimensioni è come un bibliotecario "invisibile" che ha letto e memorizzato ogni singolo libro. Quando gli viene posta una domanda, "pesca" dalla sua vasta conoscenza per elaborare una risposta, combinando i dati provenienti da più fonti per fornire una risposta che sia pertinente e coerente. Tuttavia, a differenza di un bibliotecario "umano", questo sistema non “capisce” veramente il contenuto, come potremmo fare noi. Si basa, invece, su modelli, probabilità e associazioni apprese dai testi che ha elaborato.
Il termine “grande”, in "modello linguistico di grandi dimensioni", si riferisce, come intuibile, alle sue dimensioni straordinarie, che comprendono miliardi di parametri (da intendersi come rappresentazioni matematiche di caratteristiche linguistiche quali parole, frasi e contesti). Questi parametri fungono da base per la sua capacità di generare il linguaggio.
Immaginiamo la mente di un giurista finemente calibrata e addestrata per riconoscere tutte le sfumature del linguaggio giuridico: il modello, attraverso i suoi parametri, è altrettanto in sintonia con le sottigliezze linguistiche, consentendogli di generare frasi, paragrafi o, addirittura, intere pagine che imitano il modo di esprimersi e di scrivere dell'essere umano.
Questa notevole capacità si ottiene grazie all’addestramento su grandi quantità di dati. Un modello linguistico di grandi dimensioni viene "nutrito" con testi molto diversi tra loro: libri, articoli, dialoghi, siti web, post, documenti giuridici e altro. Questi testi gli consentono di apprendere la struttura, la grammatica e le convenzioni del linguaggio. Un LLM non "impara" i fatti come un giurista, ad esempio, potrebbe memorizzare i precedenti legali, ma interiorizza le relazioni tra parole e concetti. Per esempio: quando viene richiesto a un LLM di parlare di “giustizia”, il modello attinge a innumerevoli riferimenti a questo termine contenuti nei suoi dati di addestramento, costruendo una risposta che richiama modelli e temi comuni.
Ciò che caratterizza i modelli linguistici di grandi dimensioni è la loro incredibile capacità di generare non solo frasi grammaticalmente corrette, ma anche frasi contestualmente rilevanti e significative. Quando si pone una domanda a un modello di questo tipo, esso predice la sequenza di parole più probabile in base al suo input e alla sua formazione. Questa capacità predittiva è ciò che gli consente di mantenere conversazioni credibili, di riassumere testi complessi o, persino, di redigere testi giuridici. Tuttavia, un LLM lo fa senza una vera comprensione o ragionamento; i suoi risultati sono modellati dalla probabilità statistica, piuttosto che dal pensiero per come lo intendiamo noi.
Per un giurista, le implicazioni dei modelli linguistici di grandi dimensioni sono interessantissime e profonde. Gli LLM offrono strumenti innovativi per la ricerca legale, la redazione di documenti e, persino, per l'interpretazione di provvedimenti normativi assai complessi. Immaginiamo un sistema LLM in grado di analizzare un contratto assai denso e complesso e di fornire un riassunto corretto, oppure di suggerire revisioni a quel contratto per garantirne la conformità a normative recenti. Tuttavia, questa capacità incredibile (e "convincente") solleva anche questioni importanti sull'accuratezza dei risultati e la responsabilità di chi lo usa. Senza contare che un modello linguistico di grandi dimensioni può replicare i pregiudizi presenti nei suoi dati di addestramento, può produrre risposte plausibili ma errate o generare contenuti che, pur essendo articolati, mancano di rigore giuridico. Sino ai numerosi casi, capitati negli Stati Uniti d'America, di case law completamente inventata da LLM e prodotta in giudizio.
Pur apprezzando la "potenza" di un modello linguistico di grandi dimensioni, bisogna anche riconoscere i suoi limiti. Sebbene possa imitare la forma e lo stile della scrittura umana, un LLM non vanta possibilità di giudizio critico, di ragionamento né di comprensione profonda che sono tipiche, ad esempio, di un giurista che svolge il suo lavoro. Un LLM può "solamente" riprodurre modelli di linguaggio che riflettono queste idee. I suoi risultati, quindi, devono sempre essere sottoposti al controllo umano.
In definitiva, e tirando le somme: un modello linguistico di grandi dimensioni è una prova del potere dell'intelligenza artificiale quando si confronta con la ricchezza del linguaggio umano. È uno strumento di grande utilità, in grado di trasformare il modo in cui interagiamo con i testi e le informazioni. Tuttavia, per un giurista, è anche un fenomeno da affrontare con curiosità e cautela.