F.B.L. - VoiceMeeting
VoiceMeeting sistema di sottotitolazione
1. Un po' di storia
Qualche anno fa ci siamo posti l’obiettivo di realizzare un sistema, destinato alla scuola, per la sottotitolazione di una lezione per alunni audiolesi. Abbiamo trovato nella Commissione Europea lo stesso interesse ed abbiamo collaborato con il Centro Comune di Ricerca di Ispra al progetto Voice.

Se la scuola ed i problemi degli alunni audiolesi restano al primo posto nei nostri obiettivi, VoiceMeeting ha dimostrato una versatilità applicativa non ancora del tutto scoperta:

  • è stato utilizzato nella realizzazione di uno sportello informativo di una ASL che copre le esigenze di disabili, in particolare audiolesi, ed anziani;
  • è stato proposto come sistema per l’insegnamento delle lingue straniere e come compendio, in aula, per corsi di formazione tecnica tenuti da docenti stranieri.


Nell’esperienza scolastica l’insegnante parla rivolto alla classe utilizzando un microfono. Una telecamera riprende l’insegnante, la lavagna, l’ambiente scolastico.
Microfono e telecamera sono collegati ad un personal computer che, utilizzando VoiceMeeting crea sul monitor una immagine (quella della ripresa televisiva) sottotitolata dalle parole pronunciate dall’insegnante. L’immagine può essere proiettata su grande schermo e messa a disposizione dell’intera classe.
L’alunno audioleso ed i suoi compagni di classe concentrano la loro attenzione sull’immagine creata dal personal computer.
Si raggiunge così l’obiettivo di trasmettere a tutti gli alunni della classe, le stesse informazioni, con le stesse parole, nello stesso istante.


Dalla versione 5.1 abbiamo introdotto un nuovo punto di vista: dotare l’alunno di personal computer portatile ed affidare all’insegnante un microfono.
La lezione sarà sottotitolata ad uso esclusivo dell’alunno audioleso. Il testo generato sarà salvato sul personal computer insieme alla voce dell’insegnante permettendo, con l’aiuto del tutor, una revisione dei sottotitoli. L’insegnante avrà sempre la possibilità di chiudere il microfono quando lo ritenesse necessario.
Costituisce un’altra novità della versione 5.1 la possibilità di utilizzare vocabolari specifici per materia, preparati in anticipo, e richiamarli abbinandoli, direttamente dalla barra dei comandi di VoiceMeeting, al profilo del parlatore.


Il prodotto VoiceMeeting è corredato di diverse funzioni per permettere un più efficace colloquio operatore - utente:

  • La raccolta immagini permette di archiviare una serie di immagini fisse o di filmati e di richiamarle sul monitor con un comando vocale o con la pressione di un tasto.
  • L’evidenziatore ha la funzione del pennarello che cerchia o dell’evidenziatore che colora in giallo, su di un foglio, un argomento da evidenziare. Il foglio è l’immagine che compare sul monitor, il pennarello e l’evidenziatore sono funzioni attivate con il mouse. All’interno della cornice e sul tratto giallo è possibile annotare con la tastiera.
  • La stampa dell’immagine che compare sul monitor. L’immagine proveniente dalla raccolta immagini, integrata dalle eventuali evidenziazioni e dagli appunti può essere stampata.
  • La funzione “testo”: tutte le frasi pronunciate dall’operatore ed evidenziate sul monitor al piede delle immagini, sono raccolte in un archivio. Al testo scritto è collegata la registrazione della voce che lo ha generato; al termine della conversazione l’utilizzatore può facilmente revisionare il testo.
  • La funzione “salva”: è attiva solo dalla versione 5.1 e richiede l’uso di Dragon NaturallySpeaking Professional. Permette di salvare automaticamente o su richiesta sia il testo dei sottotitoli che la voce che li ha generati. È stata introdotta per facilitare la correzione delle lezioni, in particolare modo quelle universitarie.

A disposizione dell’operatore sono una serie di opzioni che permettono un facile adeguamento della stazione di lavoro alle esigenze dell’utenza:

  • Scelta del colore dello sfondo e del testo.
  • Scelta del tipo e della dimensione del carattere.
  • Permanenza minima del testo dettato sullo schermo in funzione della lunghezza della frase pronunciata.
  • Scelta dell’operatore e caricamento del suo profilo vocale.
  • Scelta della lingua: la versione 5 permette in modo nativo di addestrare il profilo vocale di ciascun utente sia in italiano che in inglese. Altre lingue possono essere aggiunte: francese, tedesco e spagnolo.
  • Addestramento del sistema alla terminologia usata dall’operatore con la possibilità di agganciare vocabolari preparati in precedenza per ogni singola materia (solo con l’utilizzo di Dragon Naturally Speaking 5 Professional ).
 
2. Evoluzione del prodotto, allineamento alla tecnologia corrente.

I personal computer immessi di recente sul mercato, caratterizzati da un forte incremento delle prestazioni, l’utilizzo del motore di riconoscimento di Dragon Naturally Speaking ci hanno stimolato a cercare nuove soluzioni applicative che sfruttassero tutte le nuove possibilità.
La contemporanea disponibilità di nuovi strumenti per lo sviluppo software ci ha permesso di disegnare l'applicazione su basi rinnovate ottenendo anche la possibilità di creare sottotitoli contemporaneamente all’utilizzo di programmi applicativi.


Abbiamo sfruttato le possibilità del motore di riconoscimento vocale Dragon Naturally Speaking 5 di registrare, insieme al testo, anche la voce che lo ha generato per permettere una più facile revisione del testo generato.
La possibilità di utilizzo del prodotto anche su computer portatile è stata implementata.

La configurazione hardware consigliata è la seguente:

  • Processori Intel Pentium III / IV
  • Memoria RAM 256 Mb o superiore.
  • Schede di cattura video per acquisire l'immagine proveniente dall’antenna TV, dalla telecamera o dal videoregistratore.
  • Dispositivo di conversione "VGA to PAL" per rendere disponibile il segnale video in uscita, ad un televisore o ad un videoregistratore.
  • Schede audio di qualità Creative SoundBlaster o SB compatibile.
  • Sistema operativo Windows 98 / 2000 Pro / XP Pro.

Il personal computer può essere integrato con i seguenti strumenti:

  • Microfono di qualità: particolarmente consigliati i radiomicrofoni.
  • Videocamera e scheda di acquisizione video, nel caso in cui si vogliano sottotitolare immagini “in diretta”.
  • Videoregistratore, abbinato alla scheda video, per conservare l’immagine sottotitolata.
  • Videoproiettore o televisore, per permettere a più persone la contemporanea visione delle immagini sottotitolate.

VoiceMeeting presenta una grafica semplificata, raggruppando in una sola barra le informazioni:

  • Microfono (accendi/spegni);
  • Testo (leggere, riascoltare, correggere, stampare, salvare il file dei sottotitoli)
  • Utente (selezione del profilo utente e della lingua);
  • Vocabolario (selezione del vocabolario da utilizzare)
  • Opzioni (colore del testo e dello sfondo, carattere, raccolta immagini, gestione dei profili vocali con parametrizzazione delle pause e del tempo di permanenza della frase sullo schermo che diventa proporzionale al numero dei caratteri contenuti nella frase, opzioni di salvataggio).
 
3. Applicazione per le scuole: lezione frontale

Nelle scuole elementari e medie, inferiori e superiori, gli alunni seguono le lezioni sempre nella stessa aula, è perciò possibile attrezzare un’aula con le apparecchiature necessarie alla sottotitolazione delle lezioni.


Un sistema completo per la sottotitolazione delle lezioni prevede:

  • Un personal computer corredato di schede per l’acquisizione audio e video
  • Un radiomicrofono a cuffia o a cravatta
  • Una telecamera con messa a fuoco da pochi centimetri all’infinito
  • Un video proiettore
  • Uno schermo
  • I software VoiceMeeting e Dragon NaturallySpeaking nella versione Preferred o Professional.

L’insegnante utilizza il radiomicrofono, la sua voce viene raccolta dal personal computer e trasformata da VoiceMeeting in sottotitoli. VoiceMeeting controlla le pause, trascrive cioè il suono che raccoglie da pausa a pausa. Al docente è richiesto di pronunciare frasi non troppo lunghe, non troppo corte, di significato compiuto.


La telecamera raccoglie una immagine che viene elaborata dal personal computer e proiettata sullo schermo. L’immagine finale sarà quella acquisita dalla telecamera integrata dal sottotitolo.
Il docente potrà utilizzare, in alternativa alle immagini catturate dalla telecamera, filmati o immagini precedentemente inseriti nella “raccolta immagini”, richiamandoli con la pressione di un tasto o con un comando vocale.


Il video proiettore mette a disposizione dell’intera classe le informazioni (immagini + sottotitoli).


Nel personal computer vengono conservati i sottotitoli della lezione e la voce che li ha generati.


È possibile, se la scheda acquisizione video lo permette, richiamare immagini provenienti da una cassetta VHS collegando in ingresso un video registratore. Sarà anche possibile conservare la registrazione di tutta la lezione collegando in uscita un secondo video registratore.


Potranno essere sottotitolate in diretta presentazioni PowerPoint, navigazioni in Internet, programmi dell’utente. VoiceMeeting prende il controllo del personal computer all’apertura del microfono, quando si pronuncia una parola, e lo cede con un click sul desktop.

 
4. Applicazione per le università: lezione a disposizione del solo allievo

Durante una lezione universitaria si configura normalmente uno scenario diverso dalla lezione frontale:
l’allievo cambia spesso aula impedendo, di fatto, di poter attrezzare un’aula.


L’allievo dovrà essere autonomo per la sottotitolazione delle lezioni.
La sua dotazione sarà costituita da:

  • Un personal computer portatile
  • Un radiomicrofono con microfono a cravatta
  • I software VoiceMeeting versione 5.1 e Dragon NaturallySpeaking 5 Professional.

L’allievo, coadiuvato dal tutor, chiederà all’insegnante pochi minuti per addestrare un profilo vocale.
All’inizio della lezione l’allievo consegna al docente il radiomicrofono e seleziona sul personal computer il profilo vocale dello stesso docente.


L’allievo audioleso segue in diretta la lezione, leggendo i sottotitoli man mano che si creano.
Sottotitolo e voce del docente restano registrati sul personal computer (registrazione automatica o manuale) rendendo possibile una revisione successiva con l’aiuto del tutor.


L’utilizzo della versione Professional di Dragon NaturallySpeaking permette una revisione più veloce, dunque produttiva, dei sottotitoli.


L’uso del radiomicrofono consente al docente di interrompere la creazione dei sottotitoli e la conseguente registrazione della sua voce quando lo ritenga necessario.

 
Download del manuale ( 923 KB ) (questo link per ora non è attivo)
Richiesta CD dimostrativo