3.2 Definizioni

3.2.0.1 Normalizzazione e adattamento

L'adattamento del modello si ottiene, partendo da un modello esistente, mediante una ristima dei suoi parametri.

Nella normalizzazione, invece tutti i parlatori vengono normalizzati al fine di risultare simili per il modello. Anche un nuovo parlatore subirà la normalizzazione che tenderà a trasformare le sue caratteristiche vocali in quelle di un parlatore standard, normalizzato.

La normalizzazione è un procedimento che viene di solito compiuto su tutti i modelli perché ne migliora i risultati, nulla vieta di compiere un adattamento, all'arrivo di un nuovo parlatore, al fine di aumentarne ancora le performance.

3.2.0.2 Stima dei modelli supervised o unsupervised

In un approccio di tipo supervised (supervisionato) il sistema deve essere a conoscenza di ciò che il parlatore ha detto. Per conoscere univocamente cosa il parlatore ha pronunciato è necessario avere una trascrizione manuale oppure guidare il parlatore a dire delle frasi già preimpostate, chiedere conferma di ciò che è stato riconosciuto e in caso di errore correggerlo, obbligare il parlatore a scrivere ciò che vuole dire.

Nell'approccio unsupervised, invece, il sistema deve riconoscere ciò che il parlatore pronuncia. L'adattamento di tipo unsupervised è di solito preferito perché non richiede interventi da parte dell'utente. Nella realtà le performance di questo metodo sono peggiori quindi, se le esigenze delle applicazioni non lo richiedono, è preferibile utilizzare un adattamento supervised.

3.2.0.3 Stima on-line o off-line

Nel metodo off-line i dati di adattamento sono diversi rispetto alle frasi che devono essere riconosciute. Un ammontare sufficiente di frasi di adattamento viene raccolto prima di effettuare l'addestramento. In altre parole non esiste nessun vincolo temporale al processo di addestramento della rete e si possono utilizzare algoritmi e metodi più precisi anche se meno efficienti.

In molte applicazioni non vi è la possibilità di raccogliere un set di dati prima di incominciare l'addestramento. In quel caso si utilizza un addestramento di tipo on-line, in cui anche il training deve essere eseguito assieme al riconoscimento. Nella pratica vengono utilizzate le frasi appena riconosciute per compiere l'addestramento. I limiti temporali in questo caso sono ristretti.

Subsections

Stefano Scanzio 2007-10-16