Facebook es una de las redes sociales más grandes del mundo, con más de 2.800 millones de usuarios activos mensuales. Sin embargo, no todos los usuarios son reales y esto lo sabe bien la plataforma. Muchos de estos perfiles son cuentas falsas o bots que se crean para realizar otro tipo de actividades, como enviar spam, engañar a la gente, infectar con malware, o incluso realizar acciones más delicadas. 

Pero, ¿cómo hace Facebook para detectar y eliminar estas cuentas?

Sara Khodeir, ingeniera de Software en Facebook hablando sobre el modelo DEC en 2019

En el 2019, la ingeniera de Software de Facebook Sara Khodeir, dio una conferencia sobre el trabajo que hacen al respecto en su lucha contra las cuentas falsas y explicó muchas características acerca del modelo que usan para conseguir su objetivo.

Sara confirmó que Facebook elimina miles de millones de cuentas falsas cada año, pero que aún así hay un porcentaje de cuentas activas que son falsas. Según el informe de Facebook del primer trimestre de 2019, se eliminaron 2.2 mil millones de cuentas falsas y se estima que el 5% de los usuarios activos mensuales son falsos.

Así que para combatir este problema, nos explica cómo funciona el modelo usado por Facebook, llamado DEC (Deep Entity Classification). Este modelo utiliza el aprendizaje profundo para combinar diferentes características estáticas y dinámicas de las cuentas y asignarles una puntuación de riesgo.

En una parte de la conferencia, Sara explica que el aprendizaje automático es una gran solución, pero que tiene algunos problemas. Pone de ejemplo cómo investigaron y encontraron que las cuentas más nuevas eran más propensas a ser maliciosas. Para esto, crearon la características edad de la cuenta y la implementaron a su modelo.

Menciona que, si bien esto podía funcionar para detectar cuentas maliciosas y eliminarlas, en cuanto los “abusadores” se enteraban de esto simplemente hacían que sus cuentas tuvieran más antigüedad antes de hacer cualquier actividad maliciosa, y que así podían burlar sus sistemas.

Tipos de entidades que recoge el modelo DEC de un perfil de Facebook.

Sin embargo, asegura que DEC puede resolverlo.

Para esto, Sara mencionó que no solo extraían características directas de una cuenta, sino que también extraían y combinaban características de otras cuentas con las que se relacionaba, y que eso les permitía modelar no solo la cuenta en sí, sino también su comportamiento en toda la red social. A estas características les llaman entidades.

Algunos de los tipos de entidades que recopila el modelo DEC son:

  • Edad del cuenta: Una cuenta joven puede ser más propensa al abuso.
  • Número de amigos: Los bots pueden tener un número inusualmente alto de amigos.
  • Ubicación del cuenta: Algunas regiones pueden tener más cuentas abusivas que otras.
  • Análisis del comportamiento: Con qué frecuencia la cuenta publica, comenta o reacciona a las publicaciones de otros usuarios.
  • Análisis de la red: Facebook analiza con quién interactúa la cuenta en la plataforma y detecta redes anómalas de cuentas relacionadas.
  • Sistema operativo: El sistema operativo del dispositivo desde el que se registró el cuenta.
  • Datos de IP: Las dirección IP desde la que se registró la cuenta.
  • Pertenencia a grupos: Las cuentas que pertenecen a ciertos grupos pueden ser más propensas al abuso.
  • Análisis del contenido: El contenido que se publica en las páginas de la cuenta.
  • Análisis de la actividad en el sitio: Cuánto tiempo pasa el usuario en el sitio, qué páginas visita, etc.

Modelo complementario a DEC que predice si una cuenta es maliciosa usando etiquetas humanas de alta calidad

Para saber si el modelo funciona bien, se usan varios métodos diferentes con datos reales de muestra y algunos datos etiquetados por personas.

El primer método es otro modelo que usa reglas para ver el comportamiento de las cuentas. Este modelo usa datos directos.

Luego, para sacar datos de cada cuenta, se emplea un método que usa redes neuronales que aprenden de los errores.

Los datos incluyen la edad de la cuenta, el lugar donde vive, los amigos que tiene, los grupos que ha visitado y los dispositivos que ha usado y en los que ha iniciado sesión. Luego, se juntan esos datos para encontrar patrones de comportamiento e identificar grupos de cuentas falsas.

En conclusión, Facebook se enfrenta a un gran desafío para proteger a su plataforma y a sus usuarios de las cuentas falsas o bots que realizan actividades maliciosas. Es un reto demasiado grande, tanto que quizá nunca puedan cubrir por completo.

Si quieres ver la conferencia completa, lo puedes hacer a través del siguiente enlace: https://www.facebook.com/atscaleevents/videos/776557326089454

¡Nos leemos pronto!