È consigliabile applicare la tecnica dell'interpolazione in tutte quelle applicazioni utilizzate da un gran numero di parlatori. In quelle situazioni in cui è utile un adattamento incrementale, cioè in cui un utente utilizza per più volte il suo modello vocale, questa tecnica funziona molto bene. Già dopo poche frasi si può registrare un aumento delle prestazioni. Al crescere delle frasi di addestramento si può far prevalere il modello SD, ottenendo i migliori risultati ottenibili.
In base al numero di volte che dovrà essere utilizzato il modello da uno stesso parlatore, si può scegliere tra l'adattamento di tutta la rete e J-LIN.
Nel caso in cui il modello sia usato molte volte è conveniente interpolare tutta la rete. Sebbene l'interpolazione di tutta la rete sia un'operazione approssimata, dai dati sperimentali si nota che l'errore compiuto non è elevato. Si riescono così ad ottenere le prestazioni migliori, dopo un consistente numero di frasi di adattamento, peggiorando le prestazioni ottenute nelle prime frasi ed aumentano l'occupazione di spazio del modello in memoria.
Se l'applicazione è invece utilizzata per poco tempo da molti parlatori diversi, è meglio utilizzare l'interpolazione di J-LIN. Essa offre, con pochissime frasi di adattamento, prestazioni ottime e l'occupazione dei modelli in memoria 3000 volte inferiore rispetto allo spazio che serve a memorizzare l'intera rete.
La tecnica di interpolazione dei pesi può essere usata in modo duale per l'adattamento rapido all'ambiente. Avendo in possesso un modello perfettamente adattato ad un parlatore, interpolandolo con un modello addestrato con poche frasi provvenienti da un determinato ambiente, si ottengono anche in questo caso buoni miglioramenti con poche frasi. Anche l'utilizzo duale della tecnica di interpolazione dei pesi ha una buona applicabilità pratica. Può capitare, specialmente in un utilizzo remoto del riconoscitore, che un modello vocale possa essere utilizzato da ambienti differenti. Ad esempio un semplice servizio che fornisce informazioni telefoniche potrebbe essere utilizzato sia da telefono fisso che da cellulare e le stesse informazioni vocali potrebbero essere instradate su canali con rumori e caratteristiche differenti. In questo caso un adattamento al canale potrebbe essere una strategia che migliora di molto le prestazioni.
Stefano Scanzio 2007-10-16