Microsoft sufrió una de las caídas de servicios más graves de su historia, con un impacto global en plataformas clave como Xbox, Office 365, Outlook y Minecraft. La compañía confirmó que el problema se originó en Azure Front Door (AFD), su capa de distribución global, debido a un «cambio de configuración involuntario».
El pasado 29 de octubre, la plataforma de computación en la nube de Microsoft, Azure, experimentó un fallo masivo que se extendió por todo el mundo, afectando a una amplia gama de servicios tanto de Microsoft como de terceros que dependen de su infraestructura.
Según el informe oficial de la compañía, el incidente fue provocado por un «cambio de configuración involuntario» en Azure Front Door (AFD). AFD es un sistema crucial que opera como capa de distribución global, encargada de gestionar el acceso, el tráfico y la conectividad a los servicios en la nube.
La cascada de errores generada por el fallo de AFD incluyó:
- Fallos de Acceso y Autenticación: Interrupciones en los inicios de sesión y bloqueos intermitentes en portales administrativos y herramientas críticas.
- Caídas de Sesión: Pérdida de conectividad en diversas aplicaciones y plataformas.
Entre los servicios más perjudicados por esta desconexión global se encuentran:
- Productividad: Office 365, Outlook, OneDrive y Copilot.
- Entretenimiento: Xbox Network, Microsoft Store, Minecraft y Sea of Thieves.
- Infraestructura: Azure Portal, DNS y la propia autenticación de Azure.
La magnitud del outage se magnificó porque el fallo afectó a la distribución global, lo que significó que servicios de otras compañías, como Amazon, Google, Zoom, y hasta plataformas de aerolíneas, bancos y comercios, también experimentaron interrupciones al estar interconectados o depender parcialmente de la infraestructura de Azure.
Microsoft recomendó a los usuarios de Azure utilizar alternativas como PowerShell o CLI para operar y aseguró que estaban desplegando la última configuración válida conocida para resolver el problema, comprometiéndose a ofrecer actualizaciones de estado cada 60 minutos hasta la resolución total del incidente.

