[NAP CABASE ROS] IMPORTANTE: Resumen Inconvenientes Facebook FNA
Ivan Chapero
info en ivanchapero.com.ar
Mie Mar 21 17:27:34 ART 2018
Estimados,
por el presento trato de hacerles un resumen de la causa de flapeos en la
entrega de contenido del FNA en el rango de las 21 a 00 hs aprox.
Como les mencionaba en el aviso de puesta en producción, conociendo el
comportamiento de la carga de los FNA por otros sitios donde me tocó
implementarlo, hay salvedades que debían considerarse en el contexto de la
topologia de CABASE para estos equipos.
Estas observaciones fueron informada tanto a NOC como Ingeniería para que
puedan estar atentos y poder hacer un debug ya rumbeados post puesta
producción.
Varias conjeturas se cumplieron y el resultado que les interesa es el
siguiente:
* El cache en situación "estable" realiza su carga por el peering de FB en
IXP-BUE (l2l a RCN mediante). Unos 700 Mbps avg.
* Por alguna razón de su algoritmo hace 3 días consecutivos que, entre las
21 y 00 hs, la carga se muda casi al 100% por el tránsito Internet que
contratamos a SILICA en IXP-ROS.
* Como este vinculo se abona solo 150Mbps fijos y está liberado a 95 perc,
para evitarles una gran sobre-facturación a todos los miembros (700Mbps
pero de Internet), se aplicó un rate-limit al enlace Internacional de
IXP-ROS.
* Esto contiene la disparada de la factura, pero la gran reducción de BW
asignado a la carga durante estos eventos degrada el FNA. A diferencia de
otros sistemas de caches, la perfromance de carga esta linealmente ligada a
la performance de entrega.
* Por lo anterior FB correctamente ve degradado el FNA-ROS y drena el
tráfico de entrega a otros FNA. De allí las variaciones de BW entregado que
pueden notar los que están monitoreando este FNA específicamente.
Todos los días, inclusive durante los feos horarios del evento, se hizo
debug y recolectó mediciones para que desde CABASE puedan realizar los
reclamos pertinentes.
El problema de fondo no es que es caro cargarlo por Internet (cosa que lo
haría inviable económicamente), sino que no parece haber una métrica que
justifique dejar de ser cargado por el peering de FB en IXP-BUE.
El caso, con la info que estamos enviando, ya escaló dentro de FB de OPS
FNA a PEERING y luego a NOC.
Un dato muy importante, es que este comportamiento sucede casi en
sincronismo también con el FNA de CORDOBA. Por lo que pueden estar
tranquilos que no se trata de ningún factor local de ROS.
Cualquier otra duda, para servirlos.
Slds.
--
*Ivan ChaperoÁrea Técnica y Soporte*
Fijo: 03464-470280 (interno 535) | Móvil: 03464-155-20282 | Skype ID:
ivanchapero
--
GoDATA Banda Ancha - CABLETEL S.A. | Av. 9 de Julio 1163 - 2183 - Arequito
- Santa Fe - Argentina
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.cabase.org.ar/pipermail/naprosario/attachments/20180321/6e41fa5b/attachment.html>
Más información sobre la lista de distribución Naprosario