7.3 Conclusioni

La tecnica dell'interpolazione ha offerto risultati molto positivi. Mentre tutte le altre tecniche tendono ad offrire i primi risultati consistenti dopo 10 frasi, tramite intepolazione si riesce ad ottenere un aumento di circa il 3% con solo una frase. Una delle sue migliori qualità è la capacità di unire, in un unico modello, i pregi di una rete adattata all'ambiente e di una adattata al parlatore. Sebbene il coefficiente di interpolazione $\lambda $ dipenda dal parlatore, si è visto, per l'inglese, come si possa utilizzare un coefficiente fisso, ottenendo risultati peggiori rispetto al risultato ottenibile utilizzando il coefficiente $\lambda $ ottimale, ma migliori rispetto all'utilizzo di una rete adattata all'ambiente.

È consigliabile applicare la tecnica dell'interpolazione in tutte quelle applicazioni utilizzate da un gran numero di parlatori. In quelle situazioni in cui è utile un adattamento incrementale, cioè in cui un utente utilizza per più volte il suo modello vocale, questa tecnica funziona molto bene. Già dopo poche frasi si può registrare un aumento delle prestazioni. Al crescere delle frasi di addestramento si può far prevalere il modello SD, ottenendo i migliori risultati ottenibili.

In base al numero di volte che dovrà essere utilizzato il modello da uno stesso parlatore, si può scegliere tra l'adattamento di tutta la rete e J-LIN.

Nel caso in cui il modello sia usato molte volte è conveniente interpolare tutta la rete. Sebbene l'interpolazione di tutta la rete sia un'operazione approssimata, dai dati sperimentali si nota che l'errore compiuto non è elevato. Si riescono così ad ottenere le prestazioni migliori, dopo un consistente numero di frasi di adattamento, peggiorando le prestazioni ottenute nelle prime frasi ed aumentano l'occupazione di spazio del modello in memoria.

Se l'applicazione è invece utilizzata per poco tempo da molti parlatori diversi, è meglio utilizzare l'interpolazione di J-LIN. Essa offre, con pochissime frasi di adattamento, prestazioni ottime e l'occupazione dei modelli in memoria 3000 volte inferiore rispetto allo spazio che serve a memorizzare l'intera rete.

La tecnica di interpolazione dei pesi può essere usata in modo duale per l'adattamento rapido all'ambiente. Avendo in possesso un modello perfettamente adattato ad un parlatore, interpolandolo con un modello addestrato con poche frasi provvenienti da un determinato ambiente, si ottengono anche in questo caso buoni miglioramenti con poche frasi. Anche l'utilizzo duale della tecnica di interpolazione dei pesi ha una buona applicabilità pratica. Può capitare, specialmente in un utilizzo remoto del riconoscitore, che un modello vocale possa essere utilizzato da ambienti differenti. Ad esempio un semplice servizio che fornisce informazioni telefoniche potrebbe essere utilizzato sia da telefono fisso che da cellulare e le stesse informazioni vocali potrebbero essere instradate su canali con rumori e caratteristiche differenti. In questo caso un adattamento al canale potrebbe essere una strategia che migliora di molto le prestazioni.

Stefano Scanzio 2007-10-16