Las plataformas de redes sociales y mensajería que gestiona Facebook sufrieron una caída mundial el pasado lunes que dejó sin servicio a sus usuarios a nivel global durante más de seis horas. Facebook, Instagram y WhatsApp sufrieron esa caída global debido a cambios en la configuración de los routers que coordinan el tráfico de red entre los centros de datos de la compañía. El llamado protocolo BGP.
Los fallos con WhatsApp, Instagram y Facebook empezaron a notarse en torno a las 17:30 horas de este pasado lunes. Su incidencia fue global, e impidió a los usuarios acceder a las plataformas (ni a través de la app ni de la web) y enviar mensajes en el caso de WhatsApp. El servicio de las tres redes sociales comenzó a recuperarse en torno a la medianoche, seis horas después de que se detectaran los problemas de conexión, debido a "un cambio de configuración defectuoso".
La caída del servicio se debió a cambios en la configuración de los routers que coordinan el tráfico de red entre los centros de datos de la compañía, que interrumpió el tráfico. Esto "tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que paralizó nuestros servicios", explica el vicepresidente de Infraestructura, Santosh Janardhan, en el blog de Ingeniería de Facebook.
El directivo asegura, además, que no hay evidencia de que a consecuencia de esta caída se hayan visto afectados los datos de los usuarios.
La caída se debió al llamado protocolo BGP (Border Gateway Protocol), un sistemas que se utiliza en internet para llevar lo más rápido posible el tráfico allí donde se necesita. BGP es el protocolo de enrutamiento de Internet global, así como para las redes privadas de los proveedores de servicios. BGP es el protocolo que hace que Internet funcione. Lo hace habilitando el enrutamiento de datos a través de la red de redes. Cuando un usuario en Madrid carga un sitio web con servidores que están en California, BGP es el protocolo que permite que esa comunicación ocurra de manera rápida y eficiente.
Esta configuración en los routers que coordinan el tráfico de los servidores de Facebook afectó a este protocolo. Facebook dejó de anunciar las rutas a los prefijos de sus servidores de nombres de dominio (DNS) y esto hizo que aunque otras direcciones IP de Facebook estuvieran aún enrutadas, no pudieran ser encontradas. Es como si Facebook hubiese dejado de avisar al resto de la red de cómo llegar a los contenidos de sus servidores. Para las operadores de internet todos los servidores de Facebook, con todos los datos de sus servicios, habían desaparecido.