SERIE INTUITIVA DE APRENDIZAJE PROFUNDO EN AUDIO
Algoritmo y arquitectura de voz a texto, incluidos espectrogramas Mel, MFCC, pérdida de CTC y decodificador, en inglés sencillo
En los últimos años, los asistentes de voz se han vuelto omnipresentes con la popularidad de Google Home, Amazon Echo, Siri, Cortana y otros. Estos son los ejemplos más conocidos de reconocimiento automático de voz (ASR). Esta clase de aplicaciones comienza con un clip de audio hablado en algún idioma y extrae las palabras que se dijeron como texto. Por esta razón, también se conocen como algoritmos de voz a texto.
Por supuesto, aplicaciones como Siri y las demás mencionadas anteriormente van más allá. No solo extraen el texto sino que también interpretan y comprenden el significado semántico de lo dicho, para que …
#hrefhttpstowardsdatasciencecomaudiodeeplearningmadesimpleautomaticspeechrecognitionasrhowitworks716cfce4c706sourcecollectionhome0 #classew #relnoopenerAudio #Deep #Learning #simplificado #reconocimiento #automático #voz #ASR #cómo #funcionaa