iProfesionaliProfesional

¿Cómo un usuario de Fastly provocó la caída mundial de Internet?

La debacle se inició con un error informático que solo podía activarse con una configuración de cliente específica y bajo determinadas circunstancias
10/06/2021 - 08:19hs
¿Cómo un usuario de Fastly provocó la caída mundial de Internet?

Un cliente de la compañía de servicios en la nube informática Fastly provocó en forma inadvertida la caída de miles de páginas y servicios en Internet este martes. El fallo se produjo cuando el usuario cambió su configuración del servicio de forma correcta.

Sin embargo, su acción activó un error informático que llevaba un mes oculto en el software de la compañía y que hundió el 85% de su red. El vicepresidente de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha dado los detalles de la caída en un mensaje publicado este miércoles por la compañía.

Fastly desplegó software nuevo el 12 de mayo. Allí, oculto, había un error informático que solo podía "activarse con una configuración de cliente específica y bajo determinadas circunstancias", dijo Rockwell.

Ese conjunto de casualidades se dio este 8 de junio. Es como si hubiera un imperceptible agujero en la estructura de un edificio y poco después de haberlo terminado un residente colgara un cuadro justo ahí e hiciera que todo se viniese abajo.

Fastly encontró el error un minuto después del inicio del desastre, según Rockwell. Al cabo de 10 minutos habían publicado ya el primer comunicado. 45 minutos después del error encontraron dónde estaba el problema de configuración del cliente y otros 10 minutos después sus servicios empezaron a recuperarse. Fue la media hora más larga en la historia de Fastly, el día que en su empresa, vital para muchos medios de comunicación y servicios de Internet, se hizo famosa.

Fastly es una compañía llamada de red de distribución de contenidos (CDN, en sus siglas habituales en inglés). Su función es distribuir servicios en internet por miles de puntos locales en todo el mundo para acercar las páginas a los usuarios finales.

"Aunque fueron unas condiciones específicas las que provocaron la caída, deberíamos haberlo anticipado", detalló Rockwell. "Proporcionamos servicios críticos y tratamos cualquier acción que cause problemas en los servicios con la mayor sensibilidad y prioridad", añadió.

Un error de programación provocó la caída de Fastly.
Un error de programación provocó la caída de Fastly.

Concentración de proveedores

Fastly es junto a Cloudflare y Akamai una de las pocas compañías globales que sostienen Internet. Como se vio este martes, la estructura global de la red depende a varios niveles de pocos proveedores.

Esta descentralización ya se produce e incluso se promueve entre las empresas, como dijo Andy Champagne, vicepresidente de Akamai, competidora clave de Fastly, al comentar la caída de este martes.

"El uso de múltiples CDN es algo que se ha vuelto cada vez más común", dijo en un comunicado compartido por su empresa. "En teoría, las CDN múltiples proporcionan a las empresas un respaldo en caso de que una de ellas tenga un problema, pero no es una estrategia a prueba de balas. Debe aplicarse el mismo rigor a la hora de contratar proveedores incluso cuando se utilizan varias CDN, ya que la división no garantiza un tiempo de actividad del 100% para los clientes. Si una CDN sufre una interrupción, suele ser necesaria la intervención manual para dirigir el tráfico a otra CDN, no es algo automático".

El error de software afectó a miles de servidores de Internet.
El error de software afectó a miles de servidores de Internet.

Aparte de que el servicio seguiría repartiéndose entre los dominadores del mercado, el problema al que se refiere Champagne es que levantar una estructura de software para los clientes de las CDN para redireccionar el tráfico en una caída de menos de una hora, requiere un esfuerzo considerable.

Temas relacionados