Lezione 3: Modelli linguistici
di grandi dimensioni (LLM)
Definizione:
Sistemi computazionali addestrati su grandi quantità di dati testuali, in grado di generare frasi coerenti e contestualmente pertinenti attraverso il riconoscimento e l'analisi predittiva di schemi linguistici.
Concetti chiave
-
IA (Intelligenza Artificiale)
-
Dati testuali
-
Deep Learning
-
Predizione linguistica
UNITÀ 1: PREDIZIONE LINGUISTICA
Nell'odierna era digitale in rapida evoluzione, numerosi settori e discipline hanno subito cambiamenti fondamentali. La linguistica, lo studio del linguaggio, è un esempio eccellente di questa evoluzione. Con l'avvento dell'elaborazione del linguaggio naturale (NLP), abbiamo assistito all'ascesa dei modelli linguistici di grandi dimensioni o Large Language Models (LLM), che oggi sono considerati una delle innovazioni più rivoluzionarie del settore.
Ma cosa contraddistingue esattamente questi LLM? Perché sono diventati il centro dell'interesse di molti?
La notevole capacità degli LLM risiede nella loro abilità di elaborare grandi quantità di testo a una velocità straordinaria. A differenza degli esseri umani, che in genere elaborano una manciata di parole alla volta, gli LLM possono elaborare milioni di parole in un batter d'occhio. Sfruttano questa incredibile velocità per analizzare ampie serie di dati, per identificare schemi sottostanti, per prevedere le parole successive in una data frase e persino per creare frasi completamente nuove e coerenti rispetto al contesto fornito.
Tuttavia, la velocità è solo un aspetto della loro genialità. La vera meraviglia degli LLM è la portata e la profondità del loro lavoro. Questi modelli scavano in profondità negli intricati strati di dati, decifrando sfumature e relazioni che potrebbero sfuggire alla mente umana. Mentre un essere umano potrebbe riconoscere uno schema o una relazione solo dopo ore di analisi, gli LLM sono in grado di individuarlo quasi istantaneamente. Gli LLM dispongono di un vasto archivio di regole e schemi che consente loro di fare previsioni ponderate sulle parole che più probabilmente seguiranno una determinata serie o sul modo in cui completare una frase quando manca una parola. Questa capacità predittiva può essere paragonata al modo intuitivo in cui noi umani riusciamo ad anticipare il finale di una frase idiomatica o di un proverbio popolare.
Non si tratta solo di pura potenza di calcolo, ma dell'applicazione intelligente di tale potenza. Gli LLM non si limitano a elaborare i dati, ma li comprendono e li interpretano. Sono progettati per imitare la cognizione umana, anche se su scala molto più ampia. Esaminando innumerevoli esempi e riferimenti, affinano le loro capacità di indovinare, predire e generare. In sostanza, gli LLM rappresentano un connubio armonioso di velocità, portata e profondità che sta catapultando il campo della linguistica in un'era di possibilità senza precedenti.
Attività 1: Discussione
Predizione linguistica

Esploriamo come funziona la predizione linguistica con gli LLM.
Quando si comunica o si scrive, spesso si intuisce la parola che seguirà o la fine di una frase, anche se inconsciamente. Anche i modelli linguistici di grandi dimensioni (LLM) condividono questa capacità, ma su scala molto più ampia.
"Ha aperto la..."
"Il gatto si sedette sul...".
"Mentre il sole cominciava a...".
"Non poteva credere ai suoi occhi quando vide...".
Rifletti su queste frasi incomplete.
Con quale parola potrebbero terminare ciascuna frase?
Ora confronta le tue predizioni con quelle di un modello linguistico di grandi dimensioni (LLM).
Discutine con la persona accanto a te: le vostre previsioni sono simili o diverse? Perché?
Ricorda: non c'è un'unica risposta giusta e definitiva. Si tratta di capire la logica alla base delle predizioni.
Hai finito l'esercizio? Risposta possibile: Somiglianze: per la prima frase, sia la mia predizione che quella dell'LLM era "porta". Questo dimostra che gli esseri umani e gli LLM possono completare allo stesso modo alcune frasi. Differenze: per la terza frase, ho predetto "tramontare" pensando a un tramonto, mentre l'LLM ha predetto "sorgere" indicando l'alba. Questo dimostra la varietà di completamenti possibili per una singola richiesta (prompt). Ragionamento: le differenze nascono dal fatto che il linguaggio è flessibile e dipende dal contesto. Mentre "sorgere" e "tramontare" sono entrambi complementi validi, le nostre esperienze individuali, i nostri ricordi e i nostri pregiudizi possono influenzare le nostre predizioni. Gli LLM, invece, fanno predizioni basate su schemi ricavati da vaste quantità di dati testuali.
UNITÀ 2: ASSISTENZA LINGUISTICA
I modelli linguistici di grandi dimensioni (LLM) rappresentano una pietra miliare nell'incontro tra linguistica computazionale e intelligenza artificiale. Questi modelli non hanno semplicemente introdotto un nuovo metodo, ma hanno cambiato in modo significativo le nostre prospettive su come le macchine catturano, elaborano e producono il linguaggio umano (NLP).
A differenza dei modelli computazionali precedenti, che operavano sulla base di un insieme fisso di regole, gli LLM si addentrano nelle ricche sfumature linguistiche. La loro capacità di discernere le espressioni idiomatiche, di confrontarsi con le diverse allusioni culturali e di rispondere persino ai dialetti e alle espressioni colloquiali rappresenta un progresso significativo verso l'avvicinamento della comprensione delle macchine alla comunicazione genuinamente umana.
Gli scrittori, indipendentemente dalla loro esperienza, stanno rapidamente riconoscendo il potenziale degli LLM. Al di là degli ovvi controlli grammaticali, questi modelli offrono spunti per migliorare il fraseggio, lo stile e persino il ritmo del contenuto. In questo modo, contribuiscono a innalzare la qualità e l'impatto del testo scritto.
Le istituzioni educative e accademiche integrano sempre più spesso gli LLM nelle loro metodologie. Che si tratti di chiarire argomenti complessi, creare esempi illustrativi o offrire supporto nella traduzione multilingue e nell'acquisizione di una lingua, gli LLM stanno progressivamente diventando pietre miliari dell'istruzione contemporanea.
Tuttavia, le capacità linguistiche degli LLM non li rendono esenti da errori. Le loro risposte rispecchiano i dati su cui sono stati addestrati, il che può portare a dei bias (pregiudizi). È importante ricordare che il giudizio umano, insieme alle intuizioni degli LLM, garantisce una comunicazione efficace ed etica.
-
Aiuto nella stesura di saggi:
Inizia a creare una breve tesi o una frase introduttiva per un argomento a vostra scelta. Utilizza un chatbot LLM per suggerire una o due frasi successive che aggiungano profondità al tuo pensiero iniziale. -
Chiarimento rapido delle domande di ricerca:
Pensa a un concetto o a un termine che hai incontrato di recente e che ti ha messo in difficoltà. Chiedi a un LLM una spiegazione o una definizione concisa. -
Assistenza linguistica:
Prova a scrivere una frase in una lingua che stai imparando. Chiedi a un LLM di correggerla o di trovare una formulazione più simile a quella di un madrelingua.
Discussione in classe: Dopo una tua breve esplorazione, annota un'intuizione o un beneficio sorprendente che hai notato interagendo con l'LLM. Condividilo brevemente con un/-a tuo/-a compagno/-a.
Nota: Questa breve attività è stata pensata per offrire un'istantanea del mondo degli LLM e per evidenziare la loro utilità immediata in vari scenari accademici.

Attività 2: Nella pratica
Come possono aiutarci gli LLM?
Hai finito l'esercizio? Possibile soluzione: 1. Aiuto per i saggi: a) Frase iniziale dello studente: "L'impatto dei social media sulla società moderna è innegabile". b) Suggerimento LLM: "Piattaforme come Instagram, Twitter e Facebook non solo hanno cambiato il modo di comunicare, ma influenzano anche la nostra percezione della realtà e dell'autostima." 2. Chiarimenti terminologici: a) Termine impegnativo: "Meccanica quantistica" b) Spiegazione concisa di LLM: "La meccanica quantistica è una teoria fondamentale della fisica che descrive i comportamenti della materia e dell'energia sulla scala microscopica degli atomi e delle particelle subatomiche." 3. Assistenza linguistica: a) Frase iniziale (in spagnolo): "Yo gusta el libro azul." b) Correzione/suggerimento LLM "Me gusta el libro azul." Feedback/Intuizione: "Mi ha stupito la rapidità con cui l'LLM è riuscito ad approfondire la mia idea per il saggio. È stato come avere un amico esperto pronto ad aiutarmi. Può essere un ottimo strumento per le sessioni di brainstorming."
Riflessioni finali di questa lezione:
Abbiamo visto che i vasti insiemi di dati alla base dei modelli linguistici di grandi dimensioni consentono di predire e generare testi in molti modi diversi che spesso superano l'esperienza e conoscenza individuale. L'accorpamento di innumerevoli dati testuali crea una forma unica di saggezza digitale, modellata e limitata, però, dai dati che ha incontrato.
Come pensi che lo sviluppo dei Large Language Models (LLM) influenzerà la nostra vita quotidiana nel prossimo decennio?
Fonti utilizzate
TESTI
Manning, C. D., & Schütze, H. (1999). Foundations of Statistical natural language processing.
https://doi.org/10.1017/S1351324902212851
Devlin, J., Chang, M., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv (Cornell University). https://arxiv.org/pdf/1810.04805v2
Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... Amodei, D. (2020). Language Models are Few-Shot Learners. arXiv (Cornell University). https://arxiv.org/pdf/2005.14165.pdf
Jurafsky, D., & H. Martin, J. (2023, January 7). Speech and language processing (3rd ed. draft). Stanford University. https://web.stanford.edu/~jurafsky/slp3/
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is All you Need. arXiv (Cornell University), 30, 5998–6008. https://arxiv.org/pdf/1706.03762v5