Ernie Bot è appena nato e già ha conquistato il dibattito pubblico. Ecco cosa sappiamo della versione cinese del più noto chatbot ChatGPT. Oltre al fatto che è capace di creare molto hype. Dialoghi: Confucio e China Files è una rubrica in collaborazione con l’Istituto Confucio di Milano
Non è ancora disponibile al grande pubblico, eppure è già sulla bocca di tutti: anche il gemello cinese di ChatGPT ha conquistato il dibattito online, tanto in patria quanto all’estero. Si chiama Ernie Bot, in mandarino Wenxin yiyan (文心一言), ed è stato sviluppato dal colosso di internet Baidu. Il Chatbot cinese, tuttavia, non sembra ancora all’altezza dell’hype che si è generato attorno alla creatura di Open AI. Ad oggi Ernie Bot è accessibile solo in una versione di prova, e la lista d’attesa rivela numeri impressionanti: al 20 di marzo si contavano 877 mila utenti privati e 120 mila imprese. Lunedì 27 marzo doveva essere il giorno del debutto definitivo. Ma all’ultimo minuto, con un rapido cambio di programma, Baidu ha preferito un evento riservato a pochi clienti aziendali.
Cosa sa fare Ernie Bot?
Ernie Bot è innanzitutto un modello linguistico di grandi dimensioni (Large Language Model, Llm). In altre parole, alla base del chatbot vi è un complesso sistema di codici che ha come obiettivo la comprensione del linguaggio umano e la capacità di rielaborarlo per ottenere un output il più possibile simile a una risposta “naturale” all’input ricevuto. Al pari dell’omologo ChatGPT è in grado di riassumere contenuti testuali, estrapolare dati, scrivere strisce di codice, tradurre, e altro ancora. Il tutto attraverso una modalità che ricorda un motore di ricerca, ma capace di semplificare ulteriormente la fase di analisi e lettura dei risultati.
Il nuovo prodotto di Baidu, in realtà, va oltre quelle che potrebbero essere le curiosità individuali, che già nella versione trial danno il meglio di sé con i grandi interrogativi sulla vita e richieste di consigli su come gestire le finanze. Sono già numerosi gli articoli che riportano alcune di queste conversazioni, per esempio:
I risultati di Ernie Bot non nascono da un semplice tentativo di copiare il successo di ChatGPT. Baidu è stata la prima azienda cinese a lavorare attivamente nel campo dell’elaborazione del linguaggio naturale (Natural Language Processing, Nlp), la branca dell’Intelligenza artificiale (IA) che si occupa di automatizzare e naturalizzare gli output linguistici delle macchine. Nonostante lo smacco iniziale dettato dall’incertezza degli investitori a fronte di poche prove iniziali fornite dalla Big Tech, ora l’andamento delle azioni di Baidu sembra ritornato al trend di ripresa post-pandemico. Anche altre Big Tech come Tencent e Alibaba stanno lavorando ai propri modelli di linguaggio per offrire servizi di questo tipo.
“Sotto la pressione di modelli come ChatGpt, le società cinesi Llm hanno effettivamente lanciato prodotti simili molto più velocemente del previsto. Baidu ha impiegato poco meno di due mesi per rilasciare il proprio prodotto e ha dimostrato di essere quello più vicino in termini di prestazioni a ChatGpt tra gli equivalenti cinesi”, ha spiegato a TechCrunch il fondatore di Mindverse Fangbo Tao, ex ricercatore IA per Alibaba e Facebook. “Tuttavia, per sfruttare veramente Ernie Bot per costruire un ecosistema di applicazioni, potrebbe essere necessario dimostrare prestazioni più elevate in abilità come il ragionamento e la capacità di seguire determinate istruzioni. Ma il primo passo è sempre il più difficile, e Baidu è molto coraggiosa”.
Cosa non sa fare Ernie Bot
Molti netizen cinesi si trovano d’accordo con quanto constatato da Tao. “Il nostro paese ha bisogno di un suo Llm”, afferma un utente sul forum Zhihu. “Spero che si possa rompere il monopolio di OpenAI, ci vuole coraggio per lanciare un modello su larga scala in grado di competere con ChatGPT”, commenta, “Se questo tipo di percorso sia corretto o meno per il mondo dell’innovazione lo giudicheremo in futuro”. Per l’autore dell’articolo la versione di prova di Ernie Bot si guadagna un solido 65/100, ma c’è ancora margine di miglioramento.
Una delle critiche al chatbot cinese riguarda la generazione di immagini. Una carenza che sta generando molta ilarità sul web. Il modello utilizzato da Ernie Bot, Wenxin, è frutto di numerose integrazioni alla struttura iniziale costruita nel 2019. Ma l’elaborazione dei contenuti non sarebbe ancora affinata a sufficienza per rispondere alle esigenze della lingua cinese.
Ecco quindi che chiedere un’immagine di gru (inteso come macchinario), in cinese qiyouji 起重机, viene interpretata nel senso sbagliato (lo stesso vale in inglese: si richiede di mostrare una macchina di sollevamento e spostamente e si ottiene una specie di uccello). E non mancano i risvolti disturbanti, come le interpretazioni letterali dei nomi di alcuni piatti tradizionali della cucina cinese. Il mix di ingredienti per dare ai piatti il caratteristico sapore yuxiang 鱼香 (letteralmente “fragranza di pesce”) interpretato nel suo senso letterale diventa un pesce abbinato agli altri elementi della specialità citata. Di conseguenza, gli straccetti di maiale yuxiang vengono resi come un inquietante pesce ricoperto da strani filamenti di carne.
Questi incidenti non hanno impedito a Ernie Bot di guadagnarsi qualche punto con immagini più tradizionali. È quanto può succedere, ad esempio, quando si chiede di raffigurare un paesaggio naturale.
Baidu ha poi spiegato che l’algoritmo è in continua evoluzione e si arricchisce con l’esperienza. Vale a dire macinando, raccogliendo e incrociando i dati raccolti. “Giovedì a mezzogiorno [poche ore dall’esplosione della polemica sull’immagine della Turchia che sarebbe dovuta essere un tacchino, ndr.], Ernie Bot sapeva già distinguere un uccello gru dalla macchina e non confondeva il tacchino con la Turchia (anche qui il risultato era associato al termine inglese turkey, che può significare entrambe le cose). Ha anche disegnato un volto asiatico quando gli è stato chiesto un ‘bel ragazzo’”, scrive il South China Morning Post. Questa fase di costante miglioramento nel tempo, avverte però un docente della Peking University, potrebbe avvenire con molta più lentezza rispetto al competitor anglofono. Dei dieci milioni di siti più visitati al mondo, infatti, solo l’1,4% dei contenuti è in cinese mandarino, mentre il 60,4% dei testi sono in lingua inglese. Ciò significa che la mole di dati che possono essere “dati in pasto” all’algoritmo di ChatGPT è significativamente maggiore.
Infine, gli stessi filtri utilizzati per monitorare i contenuti online più sensibili vengono applicati a Ernie Bot, che – per il momento – davanti a una keyword della lista nera decide semplicemente…di non rispondere. E non finisce qui: martedì 11 aprile la Cyberspace Administration of China (Cac) ha rilasciato una bozza di un piano per regolamentare i servizi di intelligenza artificiale generativa simili a ChatGPT. La misura prevede, tra le altre cose, che le aziende forniscano della valutazioni preliminari di sicurezza prima del rilascio dei software. Come spesso accade in Cina, il governo si prepara a contenere il caos normativo che ancora ruota intorno a queste tecnologie.
Di Sabrina Moles
Formazione in Lingua e letteratura cinese e specializzazione in scienze internazionali, scrive di temi ambientali per China Files con la rubrica “Sustainalytics”. Collabora con diverse testate ed emittenti radio, occupandosi soprattutto di energia e sostenibilità ambientale.