Super Mensajes
Gmail se está actualizando para que los usuarios reciban menos spam a lo largo del día.
Gmail se está actualizando para que los usuarios reciban menos spam a lo largo del día. | Fuente: Unsplash

Google está lanzando una serie de mejoras para su servicio de mensajería Gmail con el fin que los propios filtros puedan identificar los correos de spam.

La actualización es llamada “una de las más grandes de los últimos años” y se presenta en forma de un nuevo sistema de clasificación de texto llamado RETVec. ¿En qué consiste?

Así mejora el control contra el spam en Gmail

De acuerdo con Google, este nuevo sistema permite que se pueda comprender mejor las “manipulaciones de texto contradictorias”.

En base, lo que se busca es que la inteligencia pueda reconocer correos que añaden caracteres especiales, emojis o errores tipográficos legibles para las personas, pero no fácilmente comprensibles para las máquinas.

Ahora Gmail filtrará este tipo de mensajes.

Por ejemplo, algunos correos falsos envían mensajes en el texto que dicen “mira tu cuenta” o “Felicitaciones”, pero con letras convertidas en número o símbolos matemáticos que los robots filtradores no comprenden.

RETVec está entrenado para ser resistente a manipulaciones a nivel de caracteres, incluidas inserción, eliminación, errores tipográficos, homoglifos, sustitución LEET y más. El modelo RETVec está entrenado sobre un codificador de caracteres novedoso que ‘Puede codificar todos los caracteres y palabras UTF-8 de manera eficiente’. Por lo tanto, RETVec funciona de inmediato en más de 100 idiomas sin la necesidad de una tabla de búsqueda o un tamaño de vocabulario fijo", señala la empresa.

Mejores resultados

Con RETVec, Google señala que es de código abierto y espera que libere al mundo de los ataques de los homoglifos.

RETVec parece funcionar de manera muy similar a cómo leen los humanos: es un modelo TensorFlow de aprendizaje automático que utiliza "similitud" visual para identificar qué significan las palabras en lugar de su contenido real de caracteres. La demostración de similitud de Google utiliza la misma tecnología para identificar imágenes de gatos, por lo que convertir eso en el sistema óptico de reconocimiento de caracteres más sofisticado del mundo parece bastante factible.

Según Google, este nuevo sistema brinda una mejor tasa de detección de spam hasta en 38 % con respecto al modelo anterior y reduce los falsos positivos cerca del 20 %.