Seleccionar página

Las interrupciones del servicio en la nube no son nada nuevo. Sin embargo, el cambio de 2020 a trabajar desde casa expuso toneladas de vulnerabilidades, ya que los operadores, las compañías de cable y fibra, y todas las aplicaciones populares bajo el sol experimentaron un colapso catastrófico temporal. Supuso una carga sin precedentes para los sistemas de infraestructura en la nube que respaldan sus sitios favoritos de transmisión y productividad. Estos cortes fueron una consecuencia inevitable.

Habría esperado que 2021 mostrara una mejora notable. En cambio, demostró que Internet es una baraja de cartas lista para colapsar si se retira la pieza fundamental equivocada. Ya sea por frugalidad o mala planificación, muchos sitios ponen todos sus datos y huevos de tráfico en una canasta de nube; solo una falla de nodo puede eliminar algunos de los sitios de mayor tráfico, cuando esperaríamos que estos sitios tuvieran contingencias mucho mejores en su lugar.

Vimos cómo colapsaban nuestras aplicaciones de mensajería favoritas, hogares inteligentes, redes de juegos, suites de productividad y sitios de redes sociales en un momento u otro este año. Más allá de eso, las interrupciones de Amazon Web Services (AWS) y Facebook demostraron cuánto de nuestra vida diaria depende de la nube, desde la tecnología del hogar inteligente hasta nuestras entregas de paquetes.

Mirando hacia atrás en las peores interrupciones de 2021, solo podemos esperar que las cosas mejoren en 2022. Pero no hay razón para suponer que lo harán a menos que las empresas de infraestructura en la nube y las redes de entrega de contenido (CDN) cambien la forma en que hacen las cosas y a menos que las empresas comiencen a agregar funcionalidad fuera de línea. a la tecnología basada en la nube.

1. La interrupción de AWS detiene las entregas, las cámaras y los comederos para gatos

Es probable que la reciente interrupción de AWS en diciembre aún esté fresca en su mente. Amazon Web Services supuestamente ejecuta alrededor del 33% de los servicios de infraestructura en la nube, por lo que cuando AWS se vino abajo el 7 de diciembre, es posible que se haya llevado alrededor de un tercio de los servicios en la nube.

Según el equipo de AWS (se abre en una pestaña nueva), la red interna de AWS para los servicios de supervisión, DNS interno y autorización de alguna manera desencadenó una "gran oleada de actividad de conexión que abrumó los dispositivos de red entre la red interna y la red principal de AWS, lo que resultó en retrasos en la comunicación entre estas redes". Debido a que esta red interna está vinculada a los servidores globales de AWS, provocó retrasos en el tráfico o cierres absolutos del sitio a nivel internacional durante aproximadamente 7 horas hasta que los desarrolladores pudieron reparar la red interna.

Durante las compras navideñas, las aplicaciones de los repartidores de Amazon con rutas y direcciones dejaron de funcionar, lo que les impidió completar las entregas. Los consumidores tampoco podían hacer nuevos pedidos de Amazon, lo que significa que las empresas perdieron casi un día de ingresos. Los servicios propios de Amazon Alexa, las cámaras Ring, Prime Video y Music dejaron de funcionar, lo que significa que sus videoporteros inteligentes y monitores para bebés perdieron temporalmente su valor. Y aplicaciones populares de terceros como Disney+, Venmo e iRobot fallaron gracias a su elección de proveedor de nube.

Según CNBC, los efectos de la interrupción de AWS incluso se extendieron para interrumpir los exámenes finales en las universidades, ya que algunos servicios de examen dependían de la nube para funcionar. Incluso algunos comederos automáticos "inteligentes" para gatos dejaron de alimentar a sus gatos durante el día.

Después de esta interrupción, los lectores de Android Central dijeron que desconfiaban más que antes de la tecnología para el hogar inteligente que depende de la nube. Y aunque los expertos creen que Amazon necesita incorporar controles fuera de línea en su tecnología para el hogar inteligente, también creen que es poco probable. Una vez más, esto se debe a que la nube les permite vender tecnología barata y de poca potencia que no tendría la capacidad de funcionar sin ella.

2. El metaverso se desmorona

Fuente: Nick Sutrich / Android Central (Crédito de la imagen: Fuente: Nick Sutrich / Android Central)

Si estamos hablando de las interrupciones más complicadas de 2021, tenemos que mencionar a Facebook. Justo antes del cambio de nombre de Meta, Facebook cerró accidentalmente sus propios servicios en la nube debido a "cambios de configuración en los enrutadores de la red troncal que coordinan el tráfico de red entre nuestros centros de datos", lo que provocó una cascada y provocó la caída de todos sus servicios en línea. Se aseguró de que nadie pudiera acceder a los servicios de Meta en todo el mundo, incluidos sus propios empleados.

A pesar de que los servidores en la nube de Meta solo alimentan sus propios negocios como Facebook, Instagram y Whatsapp, esta interrupción se extendió y perjudicó a otras empresas. Todos los sitios que dependían de los inicios de sesión de Facebook se volvieron inaccesibles para sus usuarios, mientras que otros sitios de compras o juegos que dependían de los servidores o tokens de Meta también se cerraron.

Además, por supuesto, esta interrupción de Facebook socavó sus propios periféricos alimentados por la nube. Los propietarios de Quest 2 ya no podían acceder a su biblioteca de juegos debido al requisito de la cuenta de Facebook, mientras que las gafas inteligentes Ray-Ban Stories perdieron su inteligencia. Comentamos en ese momento que Facebook necesita agregar soporte fuera de línea para su tecnología en el futuro.

Sobre todo, la interrupción de 6 horas de Whatsapp resultó ser el peor fiasco para la empresa. Para los millones que usan la aplicación como su forma principal de comunicarse con la familia, incluso un solo día sin ella fue demasiado. Después de la interrupción, Telegram supuestamente obtuvo 70 millones de nuevos miembros. Eso no significa necesariamente que Whatsapp haya perdido tantos usuarios, pero definitivamente vio un éxodo significativo que quizás nunca recupere.

Whatsapp, Facebook e Instagram tuvieron una interrupción similar en abril de 2021, aunque duró solo 45 minutos.

3. Elimina Internet rápidamente

Cuando algo funciona, no le prestas atención. Por lo tanto, mucha gente nunca había oído hablar de la red de entrega de contenido (CDN) de Fastly hasta que colapsó en junio, arrastrando consigo algunos de los sitios web más populares.

Una CDN ayuda a almacenar en caché el contenido para tiempos de carga más rápidos y una carga de ancho de banda reducida en los servidores de alojamiento, razón por la cual tantas empresas confían en ellos. Entregan datos a altas velocidades en todo el mundo, asegurando que los datos se transfieran a diferentes ubicaciones alrededor del mundo para mantener bajos los tiempos de carga, independientemente de dónde viva el usuario.

Pero en el caso de Fastly, una configuración de servicio defectuosa "desencadenó interrupciones en nuestros POP a nivel mundial", lo que perjudicó a los sitios que dependían de su computación perimetral. Específicamente, sitios como Amazon, Twitter, Reddit, Google, CNN, The Guardian y The New York Times se fueron todos a la vez a principios de junio. Restauró rápidamente el "95 %" de sus servicios en 49 minutos, lo que lo convierte en una interrupción amplia pero de duración relativamente corta en comparación con el resto.

4. Cuatro apagones de PSN para un año desordenado de PS5

Fuente: Android Central (Crédito de la imagen: Fuente: Android Central)

Suponiendo que haya logrado comprar una PS5 este año, es probable que haya tenido problemas para acceder a su biblioteca o jugar juegos multijugador en algún momento de 2021. Sony y CDN Akamai Technologies se han enfrentado a varias interrupciones durante el año.

La peor y más prolongada interrupción de PSN ocurrió desde finales de febrero hasta principios de marzo, lo que aseguró que algunos jugadores de PS5 y PS4 no pudieran acceder a sus bibliotecas de juegos esporádicamente durante varios días.

Sin embargo, tres cortes más en los meses siguientes indicaron que Sony tenía problemas fundamentales de red que resolver. En cada caso, los jugadores de todo el mundo encontrarían mensajes de error sobre el mantenimiento al acceder a los servicios en línea, con interrupciones que durarían entre 1 y 5 horas.

Entre los mejores juegos de PS5, muchos requieren conexiones en línea constantes o giran en torno al modo multijugador. Si Sony no puede mantener su servicio PSN funcional durante días en 2022 también, eso seguramente hará que sus fieles seguidores se sientan infelices.

5. Google no puede ayudar a sus clientes de hogares inteligentes

Nuestra primera interrupción importante de 2021 se produjo en febrero, cortesía del repentino ataque de amnesia del Asistente de Google. Si intentas hacerle una pregunta a tu altavoz Nest o Google Home, se te dirá que "el dispositivo aún no está configurado" a pesar de todas las pruebas de lo contrario. Eso hizo que fuera imposible conectarse a sus dispositivos Google Home asociados con su cuenta, desde luces inteligentes hasta tecnología de seguridad Nest. Además, la aplicación de Android Asistente de Google también tuvo problemas para responder preguntas.

Esto pareció afectar a todos los usuarios de Google Home esa noche, y los usuarios recurrieron a Reddit y a los foros de soporte en busca de ayuda. Google solucionó el problema esa noche, unas horas después de que el problema se hizo conocido, aunque no está claro cuándo comenzó exactamente.

6. La casa inteligente de Wink se apaga

Fuente: Wink (Crédito de la imagen: Fuente: Wink)

La mayoría de las peores interrupciones de 2021 afectaron a una amplia gama de sitios durante un tiempo relativamente corto. Sin embargo, el premio a la peor interrupción del año es para Wink Hubs, que cerró durante 10 días. Debido a su nueva dependencia de los servicios en la nube para funcionar, estos centros ya no podían controlar los productos Zigbee o Z-Wave, lo que los hacía casi inútiles.

Wink ofreció un 25% de descuento en sus costos de suscripción como disculpa pero, hasta donde sabemos, nunca explicó realmente qué causó el problema, solo afirmó que "optimizaría Wink Backend y nuestra API ahora que está respaldado". Muchos clientes vieron esta interrupción como una señal de que era hora de abandonar Wink para siempre.

7. El sistema de notificaciones de exposición de Android deja de funcionar

Fuente: Android Central / Alex Dobie (Crédito de la imagen: Fuente: Android Central / Alex Dobie)

Cuando se trata de rastrear contactos y prevenir la exposición al COVID-19, cualquier retraso en conocer su condición puede conducir a una mayor propagación y enfermedad. Entonces, cuando la aplicación NHS COVID-19 falló debido a problemas con el sistema de notificaciones de exposición de Android en el backend de Google, no fue una buena apariencia para Google.

Las personas que querían verificar su estado encontraron una pantalla indefinida de "Cargando". Google anunció que investigaría el problema después de aproximadamente 12 horas de informes de errores, luego tomó de 5 a 6 horas adicionales para resolver el error. Agregue la espeluznante falla de "notificación fantasma" de 2020, aparecerán notificaciones incorrectas de que los usuarios han estado expuestos a COVID-19, luego desaparecerán antes de que pueda tocarlo y la gente tenía muchas razones para desconfiar de la aplicación en ese punto.

8. Redux de interrupción de AWS

Fuente: Android Central (Crédito de la imagen: Fuente: Android Central)

Luego de la gran interrupción de AWS el 7 de diciembre, vimos una segunda interrupción de AWS el 15 de diciembre causada por problemas en las instalaciones de Amazon Web Services de Amazon en Oregón y el norte de California. Esta vez eliminó a Twitch, DoorDash, Xbox Live, PSN, Ring, Disney+ y T-Mobile.

Luego, vimos una tercera interrupción de AWS el 22 de diciembre que cerró Fortnite, Hulu, Quora, Slack e Imgur. En este caso, un corte de energía en una instalación de la costa este causó el problema. Así que eso hizo tres apagones en tres semanas. Las últimas dos interrupciones solo duraron una hora más o menos, aunque ciertamente es suficiente para causar problemas.

¿Disminuirá o crecerá el problema de cortes en 2022?

Estos diversos eventos resaltan cuán frágil puede ser nuestro actual sistema dependiente de la nube. Dado que gran parte de nuestro uso de Internet se concentra en unas pocas aplicaciones y servicios, la mayoría de los cuales utilizan algunos de los principales proveedores de infraestructura en la nube, una sola crisis puede paralizar nuestra productividad o inutilizar nuestra costosa tecnología.

Entonces, ¿podemos esperar menos contratiempos el próximo año?

Fuente: Google (Crédito de la imagen: Fuente: Google)

Para ver menos interrupciones, necesitaríamos ver más inversión en infraestructura de nube. El proyecto de ley de infraestructura reciente tiene miles de millones asignados para mejorar el acceso de banda ancha rural de alta velocidad y la ciberseguridad civil, pero la mayoría de las peores interrupciones de 2021 provinieron de errores de la empresa, no de actores hostiles. Por lo tanto, es posible que tengamos que contar con (o presionar) a las empresas para que inviertan más en la infraestructura de la nube.

Tal como está, Gartner predice que las empresas gastarán $ 482 mil millones en servicios en la nube en 2022, un aumento del 21,7%. Eso debería ser un paso en la dirección correcta, al menos.

Es importante tener en cuenta que muchas de las peores interrupciones surgieron de las redes de monitoreo internas de las empresas o de CDN de terceros, no de los servidores principales. Los mismos sistemas destinados a supervisar y prevenir interrupciones pueden hacer que todo el sistema se caiga en las circunstancias equivocadas, donde el error humano puede tener consecuencias desproporcionadas. Y si bien las CDN son vitales para proporcionar el tráfico más rápido posible, agregan un paso potencial más en el que algo puede salir mal.

Cuando un solo nodo, servidor o centro de datos puede derribar el sistema, no importa cuánto invierta. Para que las interrupciones importantes disminuyan en 2022, necesitamos que las empresas estructuren mejor sus datos, de modo que las copias de seguridad puedan activarse rápidamente hasta que se solucione el nodo problemático. Estamos mucho mejor que hace dos años, pero tenemos un largo camino por recorrer hasta que las interrupciones sean menos persistentes.

Video: