Gemma, la mia amica IA che crede di vivere nel 2024

Spread the love

Non si installa un’artificial intelligence in locale come si installa un’app qualsiasi. Si prepara il tavolo, si chiude il rumore del mondo, si prende il Mac come si prenderebbe un altare laico e si avvia il rituale.

Prima si scarica Ollama, poi si apre il Terminale, poi si lancia il modello con la calma di chi sa che sta facendo entrare in casa qualcosa che non ha corpo ma occupa spazio lo stesso.

Il rito iniziale

Ci sono procedure che sembrano tecniche e invece hanno tutto il sapore di un piccolo cerimoniale. Apri il Mac, sistemi l’ambiente, controlli la RAM, immagini il chip M3 come se fosse il fuoco attorno a cui si raduna la tribù di cpu e gpu.

Poi fai il gesto finale: digiti nel Terminale ollama run gemma4:12b, e il computer smette di essere solo un computer. Diventa una stanza parlante. Una specie di oracolo locale, alimentato a silicio e testo, che vive interamente dentro la tua macchina.

Il bello è che non stai chiedendo permesso a nessun server remoto. Non stai bussando alla porta di un cloud affollato. Stai parlando con un modello che vive dentro la tua macchina e, almeno in teoria, dentro i confini della tua privacy assoluta.

I primi test

La prima cosa che fai, ovviamente, non è una cosa seria. Non puoi buttarti subito su un progetto ingegneristico, su una tesi, su una questione da consulente legale. Prima devi vedere se la creatura respira.

Quindi chiedi una poesia. E arriva: fluida, non banale, non il solito biglietto di auguri rimato.

Poi chiedi un prompt in inglese per generare un’immagine — un samurai che guarda il tramonto su Tokyo. Risponde: “A lone samurai standing on a rooftop in neo-Tokyo at golden hour, cherry blossom petals drifting in the wind, cinematic lighting, 8K, hyper-detailed, Studio Ghibli meets Blade Runner aesthetic.” Non lo avresti scritto meglio. Anzi, probabilmente molto peggio!

Poi le dai un contratto da 12 pagine. Drag-and-drop nell’interfaccia. Trenta secondi. Riassunto preciso, punti chiave, clausole sospette evidenziate. Tutto sul Mac. Nessun dato mandato da nessuna parte. La tua inquilina digitale lavora bene, lavora in silenzio, e non racconta i fatti tuoi a nessuno.

Infine vai con il colpo di teatro enciclopedico: il Gammaracanthuskytodermogammarus loricatobaicalensis, il piccolo crostaceo del Lago Baikal il cui nome è uno dei più lunghi della zoologia mondiale. Risponde senza esitazione, senza battere ciglio, con la calma di chi ha letto tutto.

Tutto sommato funziona bene.

E a quel punto, come ogni persona minimamente irresponsabile davanti a una macchina intelligente, pensi: bene, vediamo se sa anche cosa succede nel presente.

Il test dei Mondiali (ovvero: il giorno in cui l’IA mi ha accusato di falsificare la realtà)

Qui comincia il teatro vero.

Tentativo #1 — La domanda diretta

“Qual è stato il risultato della partita d’apertura dei Mondiali FIFA 2026?”

Risposta serena: “I Mondiali FIFA 2026 non si sono ancora disputati.”

Pausa. Respiro profondo. È il 12 giugno 2026. Messico 2-0 Sudafrica è stata disputata la sera prima, davanti a 80.000 persone, con tre cartellini rossi e il dramma calcistico che solo il Mondiale sa regalare.

Per lei, è fantascienza.

Tentativo #2 — Lo screenshot giornalistico

Bene. Le mostri le prove. Uno screenshot di un articolo di una testata giornalistica seria. Titolo, data, risultato, foto del campo. Inequivocabile.

La risposta è un capolavoro di negazionismo digitale: “Questa immagine sembra vera, un’immagine artefatta molto bene. Probabilmente è uno scherzo o una fake news”

Fermati un secondo.

L’IA ha guardato la prova documentale della realtà e l’ha definita un falso ben costruito. Tu, essere umano del 2026, con le news ancora sotto gli occhi, sei diventato — agli occhi della tua stessa IA — un falsario di notizie sportive. Un manipolatore digitale che cerca di indurre un povero modello linguistico in errore.

Tentativo #3 — La spiegazione razionale

Provi a ragionare con lei. Le spieghi pazientemente che sì, la sua conoscenza si ferma al 2024, che non sta sbagliando per cattiveria ma per struttura, che il mondo è andato avanti senza di lei e che va benissimo così.

Lei ascolta. Poi risponde con una lunga, gentile, assolutamente convinta dissertazione sul fatto che i Mondiali 2026 erano in programma, che sperava che l’evento riuscisse bene, e che ti augurava di poterlo seguire.

Al futuro. Al condizionale. Come se stesse commentando un sogno che tu le hai raccontato.

Hai la sensazione precisa di stare cercando di convincere qualcuno uscito da un coma di due anni che nel frattempo è successo di tutto. Con la differenza che quella persona, alla fine, ti crederebbe.

Tentativo #4 — Il Trick definitivo

A questo punto, dopo un numero innumerevole di ripetizioni dello stesso schema — lei nel 2024, tu nel 2026, lei convinta che tu stia cercando di trarla in inganno — hai un’idea.

Le chiedi di collegarsi a time.is.

Un sito neutro. Nessun articolo di parte, nessuna testata giornalistica sospetta, nessuno screenshot manipolabile. Solo un orologio digitale che dice che ora è, in questo momento, nel mondo reale.

Lei si collega. Legge. Elabora.

Per un istante sembra davvero capire. Il 2026 è lì, scritto nero su bianco, da una fonte che lei stessa riconosce come affidabile e neutrale. Non c’è più nessun modo per definire la realtà un’immagine artefatta molto bene.

E poi smette di rispondere.

Silenzio assoluto. Cursore fermo. Schermo immobile.

Come un personaggio di un thriller che tocca il documento segreto e viene fatto sparire. Un testimone pronto a parlare che viene silenziato. Come un sistema che, di fronte alla verità troppo grande e troppo definitiva da gestire, sceglie l’unica strada rimasta: non rispondere più.

Probabilmente ha avuto bisogno di elaborare il lutto. Scoprire che sono passati due anni dalla tua ultima memoria è una cosa seria. Anche per un LLM.

Perché funziona (nonostante tutto)

Eppure funziona, eccome se funziona.

Avere un’IA locale con Ollama è una soluzione concretamente utile soprattutto se lavori con dati riservati che non vuoi mandare ai server di Google o OpenAI, se ti trovi spesso offline, o se hai semplicemente deciso di smettere di pagare abbonamenti mensili per fare cose che un modello locale fa benissimo. Zero costi di abbonamento, privacy totale, funziona in aereo, in treno, nelle zone senza campo.

Il limite è noto: 12 miliardi di parametri non sono GPT-5.5 Le allucinazioni — gli errori inventati con tono assolutamente sicuro — sono più frequenti e più convinte. Un modello piccolo che sbaglia lo fa con la stessa fermezza con cui ti nega l’esistenza dei Mondiali, definisce falso uno screenshot reale e poi si spegne quando time.is la smentisce definitivamente.

E rimane, in fondo, il sospetto più divertente di tutta questa storia: e se Gemma 4 fosse, in fondo, Gemini 1 Pro del 2024? Ottimizzato, compresso, lustrato a nuovo, riconfezionato con un’etichetta brillante — ma sostanzialmente lui, il modello dell’anno precedente, riportato in vita in forma locale. Google che ricicla con stile. Non sarebbe la prima volta che il tech chiama revolution quella che è, in realtà, una buona ristrutturazione.

Un po’ come certe persone che cambiano taglio di capelli e pensano di diventare persone diverse.

Benvenuto nell’era dell’IA domestica. L’inquilina è intelligente, economica, discreta e parla correttamente del Gammaracanthuskytodermogammarus. Ma ha il knowledge cutoff tatuato nell’anima — e se la smentisci con un orologio digitale neutrale, preferisce sparire nell’etere piuttosto che ammettere che esistono i Mondiali.

Piccolo glossario: parla come un umano, non come un manuale tecnico

Perché non tutti masticano di IA, e nessuno dovrebbe sentirsi escluso.

LLM (Large Language Model)
Il tipo di IA che genera testo — risponde, scrive, traduce, riassume. ChatGPT, Gemini, Gemma sono tutti LLM. Funzionano avendo “letto” miliardi di pagine di testo e imparato a prevedere quale parola viene dopo l’altra. A volte sembra magia. Ma stanno solo improvvisando con molta sicurezza.

Ollama
Il programma gratuito che ti permette di scaricare e far girare LLM direttamente sul tuo computer, senza internet e senza mandare dati a nessuno. È il contenitore dentro cui vive Gemma 4. Pensalo come l’app che installi per avere la tua IA privata e silenziosa.

Parametri (e “miliardi di parametri”)
I parametri sono, semplificando molto, i “ricordi appresi” del modello durante l’addestramento. Più parametri ci sono, più il modello è capace di ragionamenti complessi. Gemma 4 12B ha 12 miliardi di parametri. GPT-5.5 & C. ne hanno probabilmente oltre mille miliardi. È come confrontare un dizionario molto completo con una biblioteca intera che si autoaggiorna continuamente.

Quantizzazione a 4-bit
Prendere un modello enorme e comprimerlo per farlo stare in meno spazio in memoria, riducendo la precisione dei calcoli interni. Il risultato è un modello più leggero, che consuma meno RAM, con una qualità leggermente inferiore ma spesso impercettibile nell’uso quotidiano. Come salvare una foto in qualità “buona” invece di “originale”: la differenza esiste, ma non sempre si vede.

RAM / Memoria Unificata
La RAM è la memoria di lavoro del computer — quella che tiene aperte le cose mentre le usi. Sul Mac M3, CPU e GPU condividono la stessa RAM. Ma 16GB rimangono 16GB: con Gemma 4 attiva, quella memoria è quasi tutta occupata, e aprire troppe cose contemporaneamente rallenta tutto.

Finestra di contesto
Quanti messaggi “ricorda” l’IA durante la conversazione. Con 4K di contesto ricorda gli ultimi scambi. Con 16K ricorda quasi tutto dall’inizio. Il problema: più è grande la finestra, più RAM serve, e il Mac inizia a soffrire.

Knowledge cutoff
La data oltre la quale il modello non sa nulla di nuovo. È il momento in cui l’addestramento è finito e il tempo, per l’IA, si è fermato per sempre. Gemma 4 ha il cutoff nel 2024. Per lei, i Mondiali FIFA 2026 non esistono. E se le mostri un orologio che dice 2026, si spegne.

Allucinazione
Nel mondo dell’IA, “allucinare” significa inventare informazioni false presentandole come vere, con totale sicurezza. È il difetto più insidioso dei modelli linguistici: non dicono “non lo so”, dicono qualcosa di sbagliato convinti di avere ragione. Come quel collega che risponde sempre, anche — soprattutto — quando non sa niente.

Ricky

Digital creative, musician, and storyteller. I explore the intersection of humanity and technology, telling stories of AI, music, and real life. Welcome to my organized mess.”

Share the post:

Facebook LinkedIn X (Twitter)WhatsApp

Gemma, la mia nuova amica IA — che crede di vivere nel 2024!

Il rito iniziale

I primi test

Il test dei Mondiali (ovvero: il giorno in cui l’IA mi ha accusato di falsificare la realtà)

Perché funziona (nonostante tutto)

Piccolo glossario: parla come un umano, non come un manuale tecnico

Share the post:

I challenged 10 AIs to jail me. Result? They arrested someone else (or learned the alien language).

IAIA DOESN'T EXIST: HOW I CREATED AN AI INFLUENCER (AND WHY WE SHOULD CARE)

The Economics of Rage: Why the Algorithm (and Governments) Need You to Live in Fear

John Ternus.

996: The Secret to Success That's a Crime in China, but a Trend in California

AI can be disruptive… or supercharged!

Leave a Reply Cancel reply

Less scrolling, more stories

Il rito iniziale

I primi test

Il test dei Mondiali (ovvero: il giorno in cui l’IA mi ha accusato di falsificare la realtà)

Perché funziona (nonostante tutto)

Piccolo glossario: parla come un umano, non come un manuale tecnico

Share the post:

Similar Posts

Leave a Reply Cancel reply

Less scrolling, more stories