6.1.1 Struttura

In primo luogo verrà analizzata la struttura della rete K-LIN (figura 6.1). Essa è adatta al riconoscimento di $K-1$ parlatori. In questo paragrafo si fa riferimento a LIN per spiegare il funzionamento e la struttura della K-LIN, ma il metodo si estende immediatamente alla struttura J-LIN.

Figure 6.1: Struttura di una K-LIN
Image FIGk-lin
Il livello di ingresso è connesso a blocchi alle $K$ LIN. Da ogni nodo del livello d'ingresso partono $39 \cdot K$ pesi, per un totale di $7 \cdot 39 \cdot 39 \cdot K$ pesi. Nel caso delle J-LIN queste connessioni sono legate, come spiegato nel capitolo precedente. Durante il run-forward, ognuna delle $K$ LIN, quindi, ha in ingresso valori identici che saranno moltiplicati per pesi, che hanno valori diversi per le varie LIN. Le LIN sono collegate al livello di ingresso della rete SI tramite degli archi che collegano direttamente i nodi che hanno la stessa posizione nella LIN e nel livello di ingresso della rete SI (figura 6.2). Anche in questo livello, come per le LIN, viene fatta dalle unità della rete una trasformazione di tipo lineare. Ci saranno 273 archi per ogni LIN, con lo scopo di collegarla al livello di ingresso della rete SI. Gli archi corrispondenti ad una determinata LIN sono legati e avranno come valore $\lambda_1,\lambda_2,...,\lambda_K$. A questo livello saranno presenti $273 \cdot K$ archi.
Figure 6.2: Struttura della parte inferiore di una rete 2-LIN
Image FIG2-LIN

I parametri $\lambda $ definiscono il livello di collegamento di una determinata LIN alla struttura della rete SI. Nel caso si voglia utilizzare questo modello per effettuare un'interpolazione tra le varie LIN, i valori dei $\lambda $ saranno proporzionali al contributo di quella determinata LIN nell'interpolazione. In caso si voglia selezionare una determinata LIN, invece, basta mettere $\lambda=1$ per la LIN da selezionare e $\lambda=0$ per tutte le altre. Si vede chiaramente che in quest'ultimo caso la struttura prende la configurazione di una normale LIN esposta nel capitolo precedente. Come si nota in figura (6.1) la prima LIN non rappresenta nessun parlatore, ma è vincolata ad essere una LIN identità, cioè una LIN che non compie nessuna trasformazione sui dati di ingresso. $\lambda_1$ è inizializzato a 1 mentre tutti gli altri $\lambda $ a 0.

Questa struttura comporta un aumento del numero di archi e di nodi della rete. Alla struttura base SI vengono aggiunti 273 nuovi nodi di ingresso e $273 \cdot K$ nodi per le LIN. Vengono inoltre aggiunti invece $10647 \cdot K$ archi per il primo strato e $273 \cdot K$ per il secondo nel caso delle LIN. Nel caso delle J-LIN il numero di nodi e di archi è uguale alle LIN. Gli archi legati possono essere, al fine del salvataggio dei valori dei pesi, idealmente conglobati in un unico arco. In questo caso si può ridurre il numero de pesi: nel caso di LIN a $K+10647 \cdot K$, nel caso di J-LIN a $K+1521 \cdot K$ (tabella 6.1).


Table 6.1: Numero di unità ed archi in una struttura K-LIN
Rete Unità Archi  
Inglese + LIN $2110+273 \cdot K$ $398865+10648 \cdot K$  
Inglese + J-LIN $2110+273 \cdot K$ $398865+1522 \cdot K$  
Italiano + LIN $1844+273 \cdot K$ $319065+10648 \cdot K$  
Italiano + J-LIN $1844+273 \cdot K$ $319065+1522 \cdot K$  


Stefano Scanzio 2007-10-16