traduzione automatica
comments 2

Ottusità artificiale

Sono necessarie 20 lingue per raggiungere l’80% degli utenti online.

E, malgrado la meraviglioseria di app super smart come Word Lens, noi traduttori non abbiamo i giorni contati. Se ci immaginavate tra le fila dei mestieri tecnologicamente superati – l’equivalente odierno di un maniscalco o un carbonaio – ripensateci. Perché?

La risposta in pillole è: la traduzione fatta da una macchina, senza alcun tipo di input umano e che eguagli in qualità il lavoro di un traduttore in carne e ossa – e se possibile anche bravo – (ovvero ciò che i traduttori chiamano “qualità pubblicabile”) è allo stato attuale materiale da fantascienza, un po’ come il teletrasporto. Il che non significa molto: magari un giorno si farà. Ma non è come insegnare a un computer a giocare a scacchi.

La risposta articolata coi paroloni è: nonostante la frotta internazionale di matematici, linguisti computazionali, ingegneri informatici e luminari delle neuroscienze abbia pronosticato l’avvento imminente della traduzione totalmente automatica di alta qualità più o meno dai tempi della protostoria informatica, la FAHQT (Fully Automatic High-Quality Translation, il Santo Graal della traduzione automatica) è stata ufficialmente rimossa dalla lista degli obiettivi realizzabili già nel 1966.1

Avendo poi a che fare con lo stato dell’arte dell’ottusità artificiale su base quotidiana, non soffro esattamente d’insonnia cronica connessa a incertezza per il mio futuro. A titolo di esempio, ecco i tesori che mi dona uno dei file in post-editing di oggi:

barbabietole

“Che nome hai dato alla tua barbabietola, Palla di Lardo?”

Siccome all’output prodotto per il post-editing è dedicata parte delle nostre giornate, vi condivido anche le frasette che ho rubato a Silvia da un suo progetto di qualche giorno fa:

"Le noci contengono il sonno"
"È difficile addormentarsi con un stomaco."
"Guarda fuori di nascosto la caffeina"

E questo luminoso risultato computazionale il nostro controverso cervellone lo ottiene solo avvalendosi di massiccio intervento umano, vastissimi corpora, memorie di traduzione traboccanti di fuzzy match e segmenti sorgente tutto sommato a prova di cretino. Ecco perché ho stabilito che avrei iniziato ad agitarmi per il mio lavoro solo quando le Weyland Industries avranno implementato processi di sublimazione inversa per unire geni celtico-teutonici e silicio e produrre così l’ottava generazione di David.

David

Michael Fassbender in Prometheus, a illustrare il concetto che a Hollywood se non sei almeno crucco per metà non hai futuro nel ruolo di cyborg.

Un po’ di storia

C’era una volta un mondo che non era ancora approdato al post-strutturalismo. Era un pianetucolo illuministicamente naïf in cui si credeva comunemente che ogni aspetto della realtà, incluso l’ambito delle scienze umane, si potesse misurare scientificamente ed esprimere in maniera trasparente, completa.

In quell’epoca remota, l’impeto giovanile di matematici e scienziati era prodigalmente accompagnato da numerosi milioni di dollari di impeto istituzionale, dato che c’era una guerra mondiale da vincere e dai tempi della precedente s’era capito che o ti evolvi tecnologicamente o ti estingui come il leone delle caverne.

Tra le numerose e assortite menti al lavoro su ogni fronte del conflitto, a noi interessa particolarmente Alan Turing, cui era stato affidato il compitino di decrittare i codici delle macchine Enigma e Lorenz – le cifratrici del Terzo Reich. Per riuscirci, il suo team costruì le bombe crittologiche, dei trabiccoli mastodontici tutti valvole su valvole, come il Colossus – il primo computer digitale programmabile della storia.

L'incantevole Benedict Cumberbatch interpreta Alan Turing, alle prese con la macchina Enigma rubata ai nazisti, in The Imitation Game. A dargli manforte con sguardi intensissimi, la Knightley, l'altrettanto incantevole Matthew Goode e – ma dimmi tu - l'autista irlandese di Downton Abbey.

Il pregevole Benedict Cumberbatch interpreta Alan Turing, alle prese con la macchina Enigma rubata ai nazisti, in The Imitation Game. A dargli manforte con sguardi intensissimi, la Knightley, l’altrettanto incantevole Matthew Goode e – somma gioia! – l’autista irlandese di Downton Abbey.

Fermi tutti: ma era un post sulla traduzione, perché stiamo parlando di un matematico? Bella domanda.

Codici

La scienza della traduzione automatica propria prende le mosse solo dopo aver sconfitto la Germania, nel 1946, con Warren Weaver, direttore della divisione Scienze Naturali della Rockefeller Foundation, che invitò i suoi colleghi ad applicare alle lingue naturali i metodi imparati durante la guerra per la decrittazione del codice dei nazisti. Anche Weaver, come Turing, era un matematico.

Ora, diamo un bacino sulla fronte di matematici e ingegneri informatici. Io non ce l’ho con loro. Ma il fatto che al compito di partorire la traduzione automatica fossero stati chiamati degli ordinari monolingua che non capivano che nella traduzione non si parla di un solo messaggio, bensì di due, legati da un certo grado di equivalenza, la dice davvero lunga.2 Weaver era un brav’uomo, ma nel suo modello della comunicazione quest’ultima è a mio modestissimo avviso confusa con la trasmissione. Lo immagino mentre guardava due delle lingue che il governo degli Stati Uniti smaniava di poter tradurre su vasta scala, il russo e il cinese, pensando: “ah, cavolo, che caratterini buffi: ecco un bel codice che mi piacerebbe decrittare!”.

Diciotto anni e milioni di luridi dollari dopo (di cui 11.906.600 $ di sforzi combinati provenienti da esercito, marina e aeronautica USA), il governo degli Stati Uniti decise infine di commissionare all’ALPAC un rapporto sullo stato della traduzione automatica, di cui ho già parlato più su. Il rapporto, che doveva rispondere alla fondamentale domanda “ma allora si quaglia o no?” e che fu poi pubblicato nel 1966, è tutto riassumibile nelle parole di uno dei traduttori a cui chiesero di occuparsi del post-editing:

“Se avessi tradotto il testo da zero avrei probabilmente impiegato meno tempo di quello che mi ha richiesto l’editing. E, nonostante questo, dubito che il risultato finale sia all’altezza di quello ottenibile con una traduzione completa. La mia conclusione è che la macchina traduce una lingua straniera in cattivo inglese, una sorta di lingua creola o pidgin, che il lettore dovrebbe imparare per comprendere il senso di ciò che i russi hanno effettivamente scritto. A questo punto, potrebbe essere più semplice imparare direttamente il russo.”3

Il problema del traduttore

Affrontare la traduzione come un problema di decrittazione – o di semplice trasferimento di dati – è rappresentativo di una visione del mondo basata sul pregiudizio secondo il quale esistono informazioni obiettive che possono essere trasmesse in modo equivalente e senza perdite. Dove il significato è computabile e le ambiguità risolvibili, e in cui non c’è posto per residui comunicativi come bellezza, musicalità o implicito culturale.

In questo universo positivistico il traduttore fa un po’ la fine ingrata della lavandaia o della cameriera: più è bravo e più è invisibile, e la componente creativa del suo lavoro sempre più difficile da riconoscere. Sembra quasi un lavoro per donnine, un fare meccanico di neutra e banale estrazione di significato – quindi perché non affidarlo a una macchina, come il bucato o il cucito?

Ecco dunque perché, nonostante fior di filosofi abbia tentato di puntare il ditino sui paradossi della TA già nei primi anni Cinquanta, ai Nostri ci è voluto quasi un quinto di secolo per capire che la traduzione è un’arte di scrittura complessa, che richiede conoscenze tecniche in diversi campi.4

Torniamo a noi

“Costa troppo, più della traduzione umana.”

“Facciamo prima a insegnare le lingue alle spie.”

“L’alta qualità è irrealizzabile.”

Ciascuna di queste conclusioni fu una palata di terra cosparsa sulla bara della TA di prima generazione, che affossò con sé anche i finanziamenti al neonato campo dell’intelligenza artificiale (il rapporto ALPAC è considerato la fase iniziale di ciò che gli esperti di IA chiamano l’AI Winter).

[INTERVALLO DI VENT’ANNI, CON ROTOLACAMPO.]

ENTRANO I FAVOLOSI ANNI OTTANTA

Sono ben 15 MB di hard disk! Presto, gioiamo!

Accidenti, ma sono ben 15 MB di hard disk! Presto, gioiamo tantissimo!

Gli enormi progressi compiuti nell’hardware, la disponibilità di corpora di dimensioni brutalmente superiori e la prepotente tendenza all’ottimismo (e all’uso sconsiderato del fard) di tre decenni fa ha infine riportato in scena la traduzione automatica e il lavoro sul linguaggio naturale. Con una marcia in più: eliminando l’aspettativa di poter a breve demolire il muro delle capacità umane, si è potuto infatti lavorare al perfezionamento delle procedure, e anche con ottimi risultati. Nel 1993 è stato introdotto il metodo statistico, che – pur con le sue limitazioni – a tratti riesce ad eguagliare gli sforzi degli studenti stupidotti di primo liceo linguistico. Oggi la TA con metodo statistico è usata a pioggia da servizi corporate e gratuiti come Babelfish e Google Translate, e sa rendersi molto utile, nonostante la sua imbarazzante perseveranza nel produrre allusioni sessuali.

Il traduttore automatico di Asus ha questo potere di rimescolarti lo zen.

Il traduttore automatico di Asus ha questo splendido potere di rimescolarti lo zen.

Nel 2014, la TA:

– è in grado di tradurre di sua sponte senza toppare solo testi sorgente normalizzati o che prevedono sintassi semplificata e ambiguità ridotte al minimo (tipo le previsioni meteo);
– offre un grado di precisione di circa il 70% per i testi tecnici, quindi offre ai traduttori il 20% di marcia in più rispetto alla traduzione vera e propria (ma con qualità finale nettamente inferiore – per questo oggigiorno quando i clienti si sentono proporre il post-editing hanno un immediato sfogo di dermatite atopica);
– senza un intervento umano, e presa un po’ con le pinze, ha senso solo come alternativa all’assenza totale di traduzione. Prevedo infatti che mi sarà utilissima in Grecia, tra una settimana.

Ciao. Quando torno parliamo di parsing.

Spargi il verboTweet about this on TwitterShare on FacebookShare on Google+Share on LinkedInShare on TumblrEmail this to someone

  1. Mi riferisco al rapporto dell’ALPAC – l’Automatic Language Processing Advisory Committee – a sua volta influenzato dagli scritti di Bar-Hillel del 1951. Per quanto riguarda invece il persistere dell’amore verso i vaticini sull’avvento, qui un bell’articolo dell’anno scorso dell’Economist.

  2. Alcuni dicono comunque che parte del problema è che i traduttori hanno un po’ questo atteggiamento da ludditi o terroristi. Davvero non so cosa intendano dire.

  3. “I found that I spent at least as much time in editing as if I had carried out the entire translation from the start. Even at that, I doubt if the edited translation reads as smoothly as one which I would have started from scratch. I drew the conclusion that the machine today translates from a foreign language to a form of broken English somewhat comparable to pidgin English. But it then remains for the reader to learn this patois in order to understand what the Russian actually wrote. Learning Russian would not be much more difficult.”

  4. Non mi sto inventando tutto ciò per menare acqua al mio mulino. A proposito di residuo culturale e di scelte del traduttore, qui ne parla un vero Pro.

Filed under: traduzione automatica

by

Sono nata in Bulgaria e sono cresciuta in Italia. Mi occupo di traduzioni e revisioni creative, pignole e attente alla qualità per importanti clienti internazionali. Vivo in Olanda con il caro D. Lavoro con l'inglese, l'italiano, occasionalmente con il bulgaro.

2 Comments

  1. Piero Fiorili says

    Qualche anno fa, feci un esperimento con un traduttore automatico che allora era vantato come “il più avanzato del mondo”. Presi un testo in italiano e lo feci tradurre in inglese dal programma; poi il testo tradotto lo feci ritradurre in italiano. Dopo aver sfogato l’ilarità in privato, e fattomi serio serio, lessi il testo risultante da questi due procedimenti durante una serata conviviale, provocando negli astanti incontrollabili accessi di riso, a rischio di incontinenza urinaria. Oggi vedo che le cose vanno un po’ meglio, ma ne devono mangiare ancora di pane, prima di annunciare al mondo che la macchina può battere gli umani anche nella traduzione, oltre che negli scacchi e nel Go.
    Mi sono imbattuto solo oggi nel tuo blog, Vladina, e tanto di cappello. Non solo perché scrivi cose che condivido quasi in toto, ma soprattutto per come le scrivi. Non posso fare a meno di ridacchiare, hai una verve umoristica impagabile!

    • Vladina says

      Grazie. In realtà il settore delle traduzioni (umane) è in crescita, ma non nella percezione della persona comune. Cose che risvegliano la Gorgone dormiente piuttosto di frequente.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *