Automatic Speech Recognition Data Collection with Youtube V3 API, Mask-RCNN and Google Vision API
Fuente de la imagen: Pixabay Antecedentes Con el rápido desarrollo de Machine Learning, especialmente Deep Learning, el speech recognition se ha mejorado significativamente. Dicha tecnología se basa en una gran cantidad de datos de alta calidad. Sin embargo, los modelos creados para lenguajes no populares tienen un rendimiento peor que los de los populares, como … Leer más