Hablemos sobre las caídas e interrupciones de red

02 Oct 2020

A diario ocurren numerosas caídas de red e interrupciones en todo el mundo. Sin embargo, una empresa no es consciente de su impacto hasta que lo sufre.  

Industrias como telecomunicaciones, proveedores de servicios de Internet, Energía y Utilities, Entidades Públicas hacen la entrega de servicios críticos a sus usuarios. Por ello, necesitan proteger sus redes y asegurar que la comunicación fluye perfectamente, entregando el servicio esperado por sus usuarios. 

De acuerdo con un estudio de Gartner elaborado en el año 2014, un minuto de inactividad le cuesta a una empresa de media unos 5.600 dólares. Es decir, unos 330.000 dólares por hora.  

Si su organización gestiona servicios críticos, una inactividad de pocos minutos puede impactar seriamente sobre su organización. 

¿Cuál es el impacto de una caída de red o una interrupción? 

Mitigar el tiempo de inactividad de la red puede resultar muy costoso y cada minuto que pasa cuenta. La interrupción prolongada puede llevarlo a: 

  • Pérdidas de ingresos significativas 
  • Altos costos de reparación 
  • Reducir la productividad de sus empleados 
  • Provocar daños de reputación 
  • Pérdidas y/o fugas de datos 

5 razones por las que la red se puede ver afectada 

Error humano 

A medida que su red se vuelve más compleja, la probabilidad de error humano también aumenta, sobre todo cuando se gestionan redes críticas y/o privadas. 

Las razones principales del error humano en la gestión de red radican de los procesos manuales como ajustes o configuración, distracciones o el estrés. 

Además, es importante resaltar que los cibercriminales utilizan avanzadas técnicas de ingeniería social para introducir malware mediante ataques de phishing. 

Para minimizar los errores humanos es esencial automatizar las tareas complejas, monitorizar las actividades, establecer procedimientos, realizar formaciones periódicas y tener definido un buen plan. 

Cambios en la configuración 

Los cambios de configuración incorrectos y la configuración manual pueden provocar largos tiempos de inactividad.  

En los entornos de red multi-fabricante normalmente hay muchos elementos de proveedores y tecnologías diferentes. Es sumamente importante que estén conectados hacerles funcionar entre ellos. Por ello, deberías de poder crear circuitos de manera rápida, segura y controlada. 

En redes IP los problemas de enrutamiento son los más comunes. Cuando hablamos de redes IP no existen circuitos, sino tablas de ruta que dependen del destino de los datos. Las tablas de rutas son dinámicas y si la red se cae, ellos pueden ser reconfigurados para poder enviar la información por medio de una ruta alternativa. Sin embargo, si esa configuración no está bien ejecutada la información podría ser enviada a otra área no deseada e incluso puede perder sus datos. 

Equipos obsoletos 

Es muy complicado mantener los sistemas antiguos y los nuevos de acuerdo a los actuales SO y actualizaciones de algunos software. Un equipo anticuado que normalmente esta desactualizado puede afectar directamente al rendimiento de la red y su normal funcionamiento. Ello ocurre porque dichos sistemas antiguos y desactualizados ya no soportan las últimas actualizaciones de los SO recientes. 

Además, a medida que el tiempo pasa, la red evoluciona e incorpora nuevo equipamiento y nuevos sistemas. Hoy día, es frecuente ver empresas que gestionan aún equipamiento legacy (que puede tener más de 20 años) con sistemas y dispositivos nuevos. Es por ello por lo que la gestión se vuelve compleja. 

Somos conscientes de que compatibilidad a veces resulta un problema tedioso. Para solucionarlo, tendrás que asegurarte de que dispones de una buena herramienta de gestión y monitorización de redes para realizar el inventario y programar periódicamente las actualizaciones pertinentes. 

Las amenazas de ciberseguridad y ciber ataques 

Actualmente existen muchas amenazas de seguridad. Por ello debería de poder detectar anomalías en el tráfico de datos, determinar consumos disparatados de recursos y evitar los accesos no autorizados. 

Los ataques de denegación de servicios (DDoS) son los más empleados por los ciberdelincuentes, haciéndole perder el control de su red. Herramientas como IDS (Sistemas de Detección de Intrusos), firewalls, y VPN entre otras, le ayudan a prevenir los ataques DDoS. 

Otra cosa a tener muy en cuenta, y es que los hackers también aprovechan para atacar a través de los sistemas obsoletos. Por ello, es esencial que tus dispositivos estén todos actualizados. 

Cortes de energía 

La teleprotección es el sistema clave para las Utilities, que protege sus redes de las fallas de energía y la propagación de la falla por la red. 

Adicionalmente, en caso de falla de energía necesitas asegurar tus sistemas de respaldo suministran suficiente energía para que siga funcionando su infraestructura. De modo que puedes resolver los problemas en el menor tiempo posible. 

Las caídas de red no avisan cuando llegan. Aún teniendo sistemas de generación fuera de red debes de prevenir la falta de petróleo o la baja carga de baterías. 

Ejemplos de caída de servicio y de inactividad 

  • El gran apagón de India 

En 2012 varios apagones dejaron a más de 400 millones de personas en India sin energía eléctrica. 

El caos se produjo debido a varias deficiencias: insuficiente capacidad de generación de energía fuera de red, la falta de un buen plan de recuperación ante desastres, problemas con relés de protección y otras numerosas fallas. https://en.wikipedia.org/wiki/2012_India_blackouts   

  • Delta Air Lines 

En 2018, una de las principales aerolíneas de EE. UU. sufrió un considerable tiempo de inactividad en su red. La causa de la interrupción fue la falla del equipo que estaba afectando a un centro de datos. Como resultado, se cancelaron miles de vuelos y la compañía enfrentó un enorme impacto económico. https://www.datacenterknowledge.com/archives/2016/09/08/delta-data-center-outage-cost-us-150m  

  • Certificados caducados de O2 

Otro caso de los más resaltados del año 2018 fue el de O2 que afectó a sus usuarios en Reino Unido. El servicio de Internet cayó y la compañía tardó casi un día entero en resolver el problema y restaurar el servicio. El sistema indicaba que la falla estaba causada por un equipo de red.  

La causa raíz demostró que la inactividad de red fue provocada por un certificado caducado en las versiones de software instaladas en los clientes que sufrieron la caída del servicio.  https://www.bbc.com/news/business-46499366  

  • 2018- Century Link 

Century Link experimentó una inactividad de casi 2 días en el año 2018.  

La falla fue causada por la incorrecta configuración de red que estaba impactando directamente al centro de datos. La tarjeta de gestión de red estaba transmitiendo paquetes de datos inválidos a través de la infraestructura. La falla se extendió rápidamente por gran parte de la infraestructura de comunicaciones.  

Como resultado, muchos usuarios no podían contactar con el teléfono de emergencias, no podían retirar dinero de los cajeros automáticos, navegar por Internet…etc. 

Fue bastante complicado de resolver puesto que la empresa perdió la visibilidad de su red mientras trataban de resolver el problema. https://www.theverge.com/2018/12/28/18159110/centurylink-internet-911-outage-fcc-investigating       

  • Microsoft 

Un caso de error humano. En 2018 Microsoft sufrió una interrupción de más de 8 horas en sus servicios de Azure Cloud. Por ende, sus clientes de servicios B2B que prestan servicios críticos se vieron seriamente afectados. La razón del problema radicaba de las condiciones climáticas que estaban afectando el servicio, que empezó a experimentar problemas de rendimiento a medida que las temperaturas y la humedad fueron subiendo.

https://www.theregister.com/2018/06/22/azure_north_europe_downed_by_pleasant_weather/

Evita las caídas de red e interrupciones en el servicio 

Nuestro software de gestión de red le ayuda a evitar tiempos de inactividad e interrupciones de la red. Incluso si su red está compuesta por equipos heredados (legacy) nuestra solución le permite realizar cambios de configuración de forma controlada, así como resolver problemas de incompatibilidad mediante la gestión de red multi-fabricante y multi-tecnológica. 

¿Desea conocer más? ¡No dude en contactarnos

¿Tiene alguna pregunta o desea solicitar una demo?

Nuestro equipo de expertos está disponible para ayudar.

Contacta con nosotros