oggi andrea mi ha chiesto come dovrebbe lavorare una funzione del tipo:
%questa funzione prende in input un segnale audio
%e cerca di capire che dice prendendo possibili scelte tra parole
%a detta di da' "possibilmente ortogonali"
secondo me, facendo la correlazione dei singoli campioni audio rischiamo di prendere una grossa cantonata in quanto basta che i segnali siano ortogonali (sfasati di 90°) per sbagliare completamente.
propongo però un metodo alternativo, FORSE valido:
l'orecchio umano riconosce i suoni elaborandone delle statistiche per piccoli periodi di tempo.
se scomponessimo i segnali in piccoli pezzettini e confrontassimo, che so, l'integrale (giusto la cosa più semplice ed evidente) sui campioni, pezzettino x pezzettino registrando un errore, e sommando tutti gli errori.
Ovviamente tutti i segnali sono della stessa lunghezza, tagliati per bene e le lettere hanno una lunghezza regolare, se no cade tutt u fattariell.
che ne pensi?
Corsi di Laurea
ROX @ Unisa - Forum degli studenti di Ingegneria utilizza i cookie. Se prosegui la navigazione accetti il loro uso.
Accetto l'uso dei cookie