Qué es Whisper, el sistema de IA desconocido de OpenAI que te encantará si odias los audios de WhatsApp

Whisper es capaz de transcribir cualquier audio en texto sin casi fallos.

OpenAI quiere acabar con el largo y tedioso proceso de transcripción de un audio a texto y, por ello, ha lanzado la versión v3 de su herramienta Whisper. La empresa especializada en inteligencia artificial (IA) detrás de ChatGPT y DALL-E tiene un sistema poco conocido capaz de escribir automáticamente lo que se dice en un audio en pocos minutos y que puede serte muy útil.

Whisper es un programa open source (de código abierto) que en España se puede usar de forma gratuita a través de Hugging Face o Replicate, o de apps de escritorio como Buzz. De momento, las dos primeras opciones ya tienen acceso a la última versión y se espera que la última lo añada en breves.

Con esta herramienta, los usuarios pueden transcribir audios, ya sea un mensaje de voz de WhatsApp o una lección de clase, para que resulte más fácil hacer los apuntes.

Sam Altman, CEO de OpenAI, en el Congreso de EEUU.

El 'padre' de ChatGPT es expulsado de su propia empresa: qué sabemos del despido de Sam Altman de OpenAI

Novedades de Whisper

Aunque la versión v2 ya apuntaba maneras, Whisper v3 podría ser el equivalente a ChatGPT-3 que se lanzó a finales de noviembre del año pasado y revolucionó la idea de los chatbots. En este caso, será completamente gratuito, por lo que los desarrolladores podrán utilizarlo al 100% en sus apps.

Según la compañía, la actualización ha sido entrenada con más de un millón de horas de audio etiquetado y más de cuatro millones de horas de audio pseudoetiquetado. Comparado con su antecesor, prometen que v3 ha reducido los errores entre un 10 y un 20%.

En español, aseguran que su tasa de error se encuentra por debajo del 5%. En 20Bits, lo he probado para facilitarme la transcripción de algunas entrevistas y ha demostrado ser realmente bueno. Rara vez me he encontrado con un fallo.

¿Cómo usar Whisper?

La herramienta para transcribir audios a texto de OpenAI puede usarse en distintos lugares de Internet, pero en este artículo vamos a explicar el paso a paso dentro de Replicate. Cabe señalar que esta web detecta bastante bien los idiomas sin necesidad de que el usuario lo señale, aunque conviene hacerlo para facilitar la tarea.

Clica en el enlace: https://replicate.com/openai/whisper?prediction=u6wgsdjbn2kl3insw5ahj37kje
Convierte tu archivo de audio en .mp3 o .wav para que la página sea capaz de procesarlo.
Baja y, cuando encuentres la opción 'language', selecciona el idioma en el que está el audio.
Sigue bajando y clica en el botón con fondo negro 'Run'.
A la derecha de la pantalla comenzarás a ver el porcentaje de transcripción que lleva la IA.
Cuando termine, podrás copiar el texto y usarlo cómo quieras.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.