
OpenAI quiere acabar con el largo y tedioso proceso de transcripción de un audio a texto y, por ello, ha lanzado la versión v3 de su herramienta Whisper. La empresa especializada en inteligencia artificial (IA) detrás de ChatGPT y DALL-E tiene un sistema poco conocido capaz de escribir automáticamente lo que se dice en un audio en pocos minutos y que puede serte muy útil.
Whisper es un programa open source (de código abierto) que en España se puede usar de forma gratuita a través de Hugging Face o Replicate, o de apps de escritorio como Buzz. De momento, las dos primeras opciones ya tienen acceso a la última versión y se espera que la última lo añada en breves.
Con esta herramienta, los usuarios pueden transcribir audios, ya sea un mensaje de voz de WhatsApp o una lección de clase, para que resulte más fácil hacer los apuntes.
Novedades de Whisper
Aunque la versión v2 ya apuntaba maneras, Whisper v3 podría ser el equivalente a ChatGPT-3 que se lanzó a finales de noviembre del año pasado y revolucionó la idea de los chatbots. En este caso, será completamente gratuito, por lo que los desarrolladores podrán utilizarlo al 100% en sus apps.
Según la compañía, la actualización ha sido entrenada con más de un millón de horas de audio etiquetado y más de cuatro millones de horas de audio pseudoetiquetado. Comparado con su antecesor, prometen que v3 ha reducido los errores entre un 10 y un 20%.
En español, aseguran que su tasa de error se encuentra por debajo del 5%. En 20Bits, lo he probado para facilitarme la transcripción de algunas entrevistas y ha demostrado ser realmente bueno. Rara vez me he encontrado con un fallo.
¿Cómo usar Whisper?
La herramienta para transcribir audios a texto de OpenAI puede usarse en distintos lugares de Internet, pero en este artículo vamos a explicar el paso a paso dentro de Replicate. Cabe señalar que esta web detecta bastante bien los idiomas sin necesidad de que el usuario lo señale, aunque conviene hacerlo para facilitar la tarea.
- Clica en el enlace: https://replicate.com/openai/whisper?prediction=u6wgsdjbn2kl3insw5ahj37kje
- Convierte tu archivo de audio en .mp3 o .wav para que la página sea capaz de procesarlo.
- Baja y, cuando encuentres la opción 'language', selecciona el idioma en el que está el audio.
- Sigue bajando y clica en el botón con fondo negro 'Run'.
- A la derecha de la pantalla comenzarás a ver el porcentaje de transcripción que lleva la IA.
- Cuando termine, podrás copiar el texto y usarlo cómo quieras.
Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.
Comentarios