SERIE INTUITIVA DE APRENDIZAJE PROFUNDO EN AUDIO

Algoritmo y arquitectura de voz a texto, incluidos espectrogramas Mel, MFCC, pérdida de CTC y decodificador, en inglés sencillo

Foto por Banda sonora sobre Unsplash

En los últimos años, los asistentes de voz se han vuelto omnipresentes con la popularidad de Google Home, Amazon Echo, Siri, Cortana y otros. Estos son los ejemplos más conocidos de reconocimiento automático de voz (ASR). Esta clase de aplicaciones comienza con un clip de audio hablado en algún idioma y extrae las palabras que se dijeron como texto. Por esta razón, también se conocen como algoritmos de voz a texto.

Por supuesto, aplicaciones como Siri y las demás mencionadas anteriormente van más allá. No solo extraen el texto sino que también interpretan y comprenden el significado semántico de lo dicho, para que …


#hrefhttpstowardsdatasciencecomaudiodeeplearningmadesimpleautomaticspeechrecognitionasrhowitworks716cfce4c706sourcecollectionhome0 #classew #relnoopenerAudio #Deep #Learning #simplificado #reconocimiento #automático #voz #ASR #cómo #funcionaa