Cómo un error tipográfico acabó con Internet
Dependiendo de dónde viva y qué sitios web visite Los mejores sitios web en Internet Los mejores sitios web en Internet Una lista enorme de los mejores sitios web en Internet, en catorce categorías prácticas. Estos se consideran los sitios de primera línea que le proporcionarán lo que necesita. Lea más es posible que haya notado que Internet ha actuado el martes (28 de febrero de 2017). Innumerables sitios web fueron interrumpidos, y millones de personas se vieron afectadas. Y ahora, gracias a que Amazon admite la verdad, sabemos cómo sucedió ...
De acuerdo con el acalorado de Amazon titulado “Resumen de la interrupción del servicio Amazon S3 en la región del norte de Virginia (EE. UU.-ESTE-1)” un solo error tipográfico era responsable de acabar con Internet. Y no, eso no es un error tipográfico. Un pequeño error de un desafortunado ingeniero mató a internet durante varias horas..
¿Has intentado apagarlo y volver a encenderlo??
Como explica Amazon, a las 9:37 am, un ingeniero de Amazon “ejecutó un comando destinado a eliminar una pequeña cantidad de servidores para uno de los subsistemas S3 que utiliza el proceso de facturación de S3”. Hasta ahora, todo bien, ya que este miembro del equipo estaba haciendo exactamente lo que se les pagaba por hacer.
“Desafortunadamente, una de las entradas del comando se ingresó incorrectamente y se eliminó un conjunto más grande de servidores de lo que se esperaba.”. Estos servidores “soportó otros dos subsistemas S3,” uno de los cuales “administra los metadatos y la información de ubicación de todos los objetos S3 en la región”. Lo que creó un grave problema..
Amazon luego intentó apagarlo y encenderlo nuevamente. Desafortunadamente, “S3 ha experimentado un crecimiento masivo en los últimos años y el proceso de reinicio de estos servicios y la ejecución de las comprobaciones de seguridad necesarias para validar la integridad de los metadatos llevó más tiempo del esperado.”. Por lo tanto, tomó hasta la 1:54 pm para que todo volviera a funcionar correctamente..
Para evitar una repetición de rendimiento, Amazon es “Haciendo varios cambios como resultado de este evento operacional.”. Esto incluye introducir “Medidas de seguridad para evitar que se elimine la capacidad.,” “auditando nuestras otras herramientas operativas para asegurarnos de que tenemos controles de seguridad similares,” y haciendo “Cambios para mejorar el tiempo de recuperación de los subsistemas clave S3.”.
Te dijimos que los errores tipográficos siempre importan
Una vez opiné que los errores tipográficos siempre importan, incluso en línea y en mensajes de texto Por qué los errores tipográficos siempre son importantes, incluso en línea y en mensajes de texto [Opinión] Por qué los errores tipográficos siempre son importantes, incluso en línea y en mensajes de texto [Opinión] Todos cometemos errores de vez en cuando . Es natural, una parte de la vida, una curva de aprendizaje que usamos para mejorarnos a nosotros mismos. Los errores tipográficos no son una excepción. Ocurren a menudo, y si la escritura forma un ... Leer más. Este desafortunado incidente seguramente lo confirma, ya que demuestra el impacto devastador que puede tener un error tipográfico solitario. De acuerdo, no todos somos ingenieros de Amazon encargados de mantener Internet funcionando, pero aún así, no hay excusa!
¿Te afectó el corte de Amazon el martes? ¿Qué sitios web notaste actuando mal? ¿Cómo te sientes acerca del hecho de que un solo error tipográfico acabó con Internet? ¿Qué debe hacer Amazon para evitar una repetición de rendimiento? Por favor háznoslo saber en los comentarios más abajo!
Crédito de la imagen: Marco Verch a través de Flickr
Explore más acerca de: Amazon, Cloud Computing, Web Server.