¿Cuál es el súper poder para detectar micro-ráfagas invisibles?

Edouard Karam, director de marketing de soluciones y estrategia de productos, Accedian

Las micro-ráfagas son invisibles sin un monitoreo extremadamente granular. Seguidamente le mostramos cómo encontrarlas y controlarlas para que sus clientes estén satisfechos.

La mayoría de los enlaces de red de proveedores de servicios funcionan con una utilización promedio inferior al 10%. Estos enlaces cuestan decenas de miles de dólares para operar y tiene sentido económico poder agruparlos y alimentar múltiples enlaces de baja utilización en un número menor de puntos de concentración. La agrupación se usa a menudo dentro de la red de acceso lo que proporciona conectividad a muchos puntos finales.

Pero, por supuesto, en algún momento se creará un punto de concentración lo que podrá traer como consecuencia la posibilidad de generar cuellos de botella en la red.

Se puede ver esto de manera bastante dramática cuando la agrupación de operadores se aplica en una red LTE-Advanced para aumentar el ancho de banda y, por lo tanto, la tasa de bits. Aquí la técnica se utiliza para combinar múltiples portadores de componentes LTE en todo el espectro disponible para admitir señales de ancho de banda más amplio, aumentar las velocidades de datos y mejorar el rendimiento de la red.

Sin embargo para admitir este tipo de agrupación los CSP deben usar memorias intermedias estáticas o dinámicas para administrar la sobresuscripción instantánea en diferentes niveles o “saltos” de la red. Demasiado almacenamiento en búfer aumenta la latencia de extremo a extremo, por lo que los búferes deben ajustarse según las aplicaciones de red.

Y aquí es donde el efecto del almacenamiento en búfer lleva al problema de ráfagas y a los problemas muy serios que estos pueden crear.

¡Oh agrupación!, qué caos de micro-ráfagas creas!

Toda esta agregación y almacenamiento en búfer, cambia los patrones de tráfico en cada salto creando fluctuaciones de paquetes a lo largo de los enlaces y, por lo tanto, aumenta la ráfaga de tráfico. Esta ráfagas se agravan cuando los sistemas operativos multitarea (como puede ser un componente NFV, por ejemplo) que ejecutan múltiples aplicaciones le añaden tiempo de CPU al proceso de red; envían tantos datos como puedan en el menor tiempo posible.

Todos estos factores contribuyen en volver el tráfico de la red muy explosivo. Esto no sería un problema si pudiera detectar fácilmente todas las ráfagas, identificar sus causas y ajustar los parámetros de operación de la red para evitar problemas de experiencia de usuario.

Pero no todas las ráfagas se detectan fácilmente. De hecho algunas son invisibles, si no se tiene una frecuencia de muestreo extremadamente granular.

La micro-ráfaga invisible pero mortal

Las micro-ráfagas (ráfagas rápidas de paquetes de datos enviados en rápida sucesión, llevan a períodos de transmisión de velocidad completa del medio y que pueden desbordar los búferes de paquetes en diferentes niveles de la red) siendo comunes y complicados de administrar o prevenir porque son difíciles de detectar y monitorear.

Aunque las micro-ráfagas son de corta duración (milisegundos) pueden causar una degradación significativa del desempeño de la red y de la aplicaciones en forma de latencia aumentada, fluctuación de fase y pérdida de paquetes. El impacto es particularmente severo con aplicaciones que requieren transmisiones de datos confiables, de alta velocidad y baja latencia, como el comercio de alta frecuencia en redes financieras o servicios de comunicaciones de baja latencia ultra confiables 5G (uRLLC).

La mayoría de los CSP utilizan herramientas de monitoreo que brindan datos con una resolución de minutos o, en el mejor de los casos, segundos. Esto es lo suficientemente granular para medir el ancho de banda promedio, pero está muy por debajo de la marca para detectar micro-ráfagas. Dado que las micro-ráfagas duran una fracción de segundo se pueden esconderse fácilmente en un promedio de 1 segundo o aún de 100 milisegundos.

El siguiente gráfico muestra una representación de alto nivel de la frecuencia de muestreo en el mismo conjunto de datos con micro-ráfagas presentes. Al aumentar la frecuencia de muestreo (de 100 ms a 1 ms) se vuelve evidente el impacto de las micro-ráfagas en la tasa de información comprometida (CIR).

Para identificar posibles problemas de capacidad es obvio que se necesita una herramienta que pueda monitorear una red en tiempo real con una resolución de 1 ms. ¡Existe!

Revelación de micro-ráfagas invisibles

Aquí hay algunas noticias importantes: la función de medición de utilización de ancho de banda (medidor de flujo) en la solución Skylight de Accedian ahora proporciona una granularidad de muestreo de hasta 1 milisegundo. ¡Las micro-ráfagas ya no pueden esconderse!

La función de medición pasiva del medidor de flujo de la Skylight y el motor de informes miden el rendimiento (mínimo, máximo, promedio) y las estadísticas de paquetes. Se puede habilitar en cualquier ubicación donde esté instalado un sensor Skylight para informar con granularidad tan precisa como 1 milisegundo.

Pero espere, ¡hay más! Aquí se encuentran otros dos componentes relacionados con la detección de micro-ráfagas para tener en cuenta en el conjunto de soluciones Skylight de Accedian:

  • Sensor de Skylight: los módulos cuentan con capacidades excepcionalmente precisas de marcado de tiempo en los datos, que admiten precisión de microsegundos. Esto elimina la variación causada por los controladores de kernel estándar.
  • Al utilizar el análisis de desempeño de Skylight —plataforma de análisis nativa en nube de Accedian para gestión de la calidad de experiencia (QoE)— se pueden detectar patrones en los datos de desempeño que ayudan a correlacionar y aislar problemas.

Para concluir pensamos que sería valioso dejarle algunos consejos no solo para detectar sino también para prevenir el efecto negativo de las micro-ráfagas.

Eliminación del caos de micro-ráfagas!

Los métodos para minimizar el impacto de las micro-ráfagas están de acuerdo con las características de red específicas de cada CSP. Pero aquí hay en general algunos remedios potenciales.

Almacenamiento en búfer flexible

Mejorías en arquitecturas de conmutación ahora permiten reenviar paquetes con un retraso mínimo. Los conmutadores no almacenan los paquetes en la mayoría de los casos y pueden reenviarlos en microsegundos. Sin embargo si se genera congestión (debido a micro-ráfagas) los paquetes deben ponerse en cola dentro de un conmutador. Algunos conmutadores tienen unos pocos kilobytes de memoria de paquetes de ingreso por puerto. Cuando todos los puertos están congestionados al mismo tiempo estas arquitecturas pueden manejar pequeñas cantidades de congestión.

Cuando la micro-ráfaga crea congestión la asignación flexible del búfer consiste en asignar dinámicamente el búfer a los puertos que lo necesitan. Los paquetes se reenvían en casos normales en modo de corte con almacenamiento en búfer limitado. Cuando ocurre la congestión cada puerto puede usar el almacenamiento en búfer dinámico para almacenar paquetes hasta que la congestión desaparezca. La asignación dinámica de las memorias intermedias de paquetes limita el impacto del aumento repentino del ancho de banda y por lo tanto evita la pérdida de paquetes. (Sin embargo, esto afecta la latencia general del paquete).

Modelado de tráfico (traffic shaping)

Una vez que se detectan las micro-ráfagas y se ubica en áreas específicas de la red, se pueden aplicar técnicas de modelado de tráfico (traffic shaping) para suavizar los patrones y así reducir las mismas. Estas técnicas de modelado (shaping) pueden destinarse a áreas específicas de la red sensibles a la latencia.

El modelado de tráfico (traffic shaping) es una técnica de administración de ancho de banda que retrasa algunos o todos los paquetes para que cumplan con el perfil de tráfico deseado. Sin embargo el modelado de tráfico estándar no puede suavizar eficazmente las micro-ráfagas y la granularidad de la mayoría de los modeladores no es suficiente para procesar el tráfico a esta velocidad. Una alternativa llamada micro-modelado (micro-shaping) —que optimiza el ancho de banda por paquete— es capaz de “modelar” micro-ráfagas, sin pérdidas, lo que proporciona una utilización (llenado) de la capacidad de ancho de banda mucho mejor sin el descarte de paquetes asociado con técnicas de modelado de tráfico tradicionales.

División de aplicaciones con ráfagas o dedicación de ancho de banda

En ciertas situaciones es posible rediseñar partes de la red que son menos sensibles a la latencia para manejar aplicaciones con ráfagas (y posiblemente menos importantes). En tales casos el tráfico se envía en rutas específicas y / o clases de servicio (CoS).

También hay opciones más simplificadas como aumento del ancho de banda para permitir el tráfico más explosivo o vigilar aplicaciones de menor prioridad en algunas partes de la red.