For a Human-Centered AI

Marco Gaido riceve il Best Student Paper Award all’IWSLT 2022

14 Giugno 2022

Il suo lavoro, intitolato "Who Are We Talking About? Handling Person Names in Speech Translation", si aggiunge al gran numero di recenti pubblicazioni dell'unità di traduzione automatica nell'area della traduzione vocale.

Marco Gaido, dottorando presso l’unità di ricerca sulla traduzione automatica, ha ricevuto il premio come miglior studente alla conferenza internazionale sulla traduzione linguistica parlata (IWSLT 2022)

In particolare, il documento di ricerca si concentra sul problema del riconoscimento e della traduzione corretta di entità specifiche (nomi di persona) presenti nei dati vocali.

La sua soluzione prevede la creazione di modelli in grado di gestire un vasto range di caratteristiche fonetiche tali da risultare robusta all’errata pronuncia di nomi di persone di diverse nazionalità.

Dalle conclusioni del documento: “Gli esseri umani e le macchine hanno punti di forza e di debolezza dversi. Tuttavia, abbiamo dimostrato che quando si tratta di nomi di persona nel discorso, entrambi faticano a gestire nomi in lingue che non conoscono e nomi che non sono abituati a sentire. Questa scoperta sembra suggerire che gli esseri umani non possono aspettarsi aiuto dalle macchine in questo senso, ma abbiamo dimostrato che c’è speranza, […] In effetti, poiché le macchine sono più veloci degli esseri umani, possiamo addestrarli su più dati e più lingue. Inoltre, siamo in grado di progettare soluzioni architettoniche dedicate volte ad aggiungere un bias induttivo e a migliorare la capacità di gestire elementi specifici“.

““Siamo particolarmente orgogliosi di questo risultato” – afferma Matteo Negri, coautore del paper insieme a Marco Turchi -. “La ricerca sottostante alza l’asticella nella traduzione vocale, aprendosi a nuove strade in cui tradurre significa molto di più che rendere correttamente i contenuti vocali in una lingua diversa. In effetti, i nostri sforzi continui mirano all’obiettivo più ambizioso di migliorare l’output dei nostri sistemi con informazioni semantiche – in questo caso, l’annotazione di entità nominative presenti in un discorso – adatte a una varietà di compiti a valle. Verso questo obiettivo, che si trova al crocevia tra la traduzione vocale e l’elaborazione del linguaggio naturale, il premio rappresenta una prima importante pietra miliare sia per Marco che per il nostro gruppo.”.”


Autore/i