Los filtros de spam de Gmail ahora son mejores que nunca, gracias a una nueva tecnología de Google

La compañía estadounidense lleva probando su herramienta durante un año en su plataforma de correo electrónico para evitar emails no solicitados. Ahora, han liberado el código para que cualquiera pueda usarlo. 
Gmail ha logrado reducir la cantidad de spam que se salta el filtro de correos no deseados de la plataforma gracias a una nueva herramienta.
Gmail ha logrado reducir la cantidad de spam que se salta el filtro de correos no deseados de la plataforma gracias a una nueva herramienta.
CanvaName de Flowicon / Yogas Design de Unsplash / Montaje: 20Bits
Gmail ha logrado reducir la cantidad de spam que se salta el filtro de correos no deseados de la plataforma gracias a una nueva herramienta.

El spam es lo que comúnmente denominamos ‘correo basura’, es decir, esos emails que no hemos solicitado, pero inundan nuestra bandeja de entrada en Gmail u Outlook. Por suerte, las plataformas de correo electrónico cada vez disponen de más herramientas para detectar cuando un mensaje se trata de promociones que se envían de forma masiva y que no hemos pedido, y cuando al usuario realmente puede interesarle el contenido.

Gmail es la plataforma de email más famosa en España y la que más está trabajando en evitar que los correos no deseados ensucien la bandeja de entrada de sus consumidores. Para combatir el spam, utilizan tecnologías novedosas capaces de detectar incluso los que usan técnicas muy avanzadas para intentar sobrepasar los filtros.

Según Google, la compañía detrás de Gmail, su nueva herramienta es un 38% mejor que las tácticas que usaban hasta ahora para detectar spam. De este modo, los investigadores calculan que reducirán la cantidad de falsos mensajes buenos en un 19,4% y el procesamiento llegará a un 83%.

Las tácticas de los spammers para colar sus correos no deseados en Gmail

Muchos de los correos de spam que llegan a nuestra bandeja de entrada actualmente utilizan homoglifos. Es decir, caracteres que parecen otros para que los usuarios los lean como si estuviesen escritos correctamente, pero que a un filtro automático le resulta complicado detectar.

Por ejemplo, hay mensajes de spam que emplean el número '0' para sustituir la 'O' mayúscula. Depende que caligrafía digital se utilice, se puede parecer más o menos este carácter y, así, pasan más o menos desapercibidos.

También se recurre a palabras clave que detectan los algoritmos como buenos o a faltas ortográficas que insertan en los mensajes queriendo. Normalmente, hay tildes u otros errores en los que los usuarios no nos fijamos a la hora de leer un correo rápidamente porque los corregimos mentalmente sin darnos cuenta.

¿Cómo lucha Google contra el nuevo spam?

Con el objetivo de deshacerse de estos molestos emails que, en ocasiones, solo muestran propaganda, pero pueden llegar a ser más preocupantes y ser estafas, Google ha creado RETVec. Un nuevo tipo de vectorizador de texto que es capaz de detectar las técnicas mencionadas anteriormente que usan los spamers para colarse en nuestra bandeja de entrada.

RETVec es un modelo que ha sido entrenado sobre un nuevo codificador de texto y que es capaz de codificar todos los caracteres. Esta herramienta funciona en más de 100 idiomas diferentes, entre los que se incluye el español.

Según explican los desarrolladores del vectorizador, no se basa en una lista con millones de palabras que comprueba automáticamente. En vez de eso, esta tecnología innovadora solo utiliza 200.000 parámetros, funcionando de forma similar a la lectura de un texto por parte de un ser humano y simplificando el proceso de detección de spam.

El modelo que han estado usando durante un año en Gmail recurre al aprendizaje automático y se basa en la "similitud" de las palabras y no en las letras que realmente están escritas en el correo. Así, Google se evita de necesitar un gran servidor para ejecutar millones de comandos.

Además de estar usándose para el correo electrónico de Google, otras empresas podrán utilizarlo, ya que sus desarrolladores han liberado el código fuente de RETVec. De este modo, cualquiera podrá usar su invento en sus propios servidores para, por ejemplo, compartir los comentarios de spam de sus páginas web.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Mostrar comentarios

Códigos Descuento