6. Tecnica K-LIN

In questo capitolo verrà descritta e sperimentata una tecnica di adattamento al parlatore che si basa sia sulla trasformazione del modello che sulla categorizzazione del parlatore.

Questa struttura permette, anche se con risultati peggiori rispetto alla tecnica più utilizzata dei modelli di Markov a densità continua (GMM), di compiere il riconoscimento del parlatore. Come abbiamo analizzato nel capitolo precedente, le strutture LIN e J-LIN hanno un'elevata capacità di adattarsi, anche con poche frasi, ad uno specifico parlatore. I risultati che si riescono ad ottenere sono di circa il 6% superiori rispetto al modello SI.

LIN e J-LIN compiono una trasformazione sui patterns di ingresso di un determinato parlatore, al fine di rendere quello che è stato detto il più possibile simile ad un parlatore medio. Ad ogni parlatore sarà associata una trasformazione diversa. Visto da un'altra angolazione i 1560 parametri di J-LIN e i 10920 parametri di LIN, possono essere considerati come una caratteristica del parlatore, come un'impronta vocale. In effetti sono la differenza tra uno specifico parlatore ed uno medio.

Si è pensato di riuscire ad utilizzare quest'informazione presente in LIN e in J-LIN al fine di individuare in modo automatico il parlatore per poter utilizzare il modello selezionato per il riconoscimento di tutte le frasi pronunciate da quel parlatore. Un approccio del genere ha l'indiscutibile vantaggio di non dover richiedere al parlatore l'autenticazione. Automaticamente il sistema è in grado di riconoscere il parlatore e di associarlo alla sua LIN o J-LIN.



Subsections
Stefano Scanzio 2007-10-16