Récemment, nos clients nous ont toujours posé la même question : nos utilisateurs étrangers sont toujours bloqués pour regarder des vidéos en tant que PPT, existe-t-il une solution fiable ? Pour être honnête, ce qui se cache derrière cette question est en fait le noyau dur de la latence du réseau mondial. J'ai géré un grand nombre de projets vidéo multinationaux, le test réel a révélé que de nombreuses équipes pensent qu'il suffit d'acheter un CDN pour s'en sortir, le résultat est la réalité - les nœuds n'ont pas choisi le bon, la stratégie de planification est nulle, la soi-disant “couverture mondiale” est simplement un exercice de papier.
Le problème de latence de la transmission vidéo à l'étranger est essentiellement un jeu de distance physique et de topologie de réseau. Les paquets traversant l'océan, chaque saut de 1000 km augmente le temps de latence de 5 à 10 ms, sans parler de la possibilité de rencontrer une congestion au milieu de la ligne ou des opérateurs peu fiables. Certains fournisseurs de services CDN se vantent d'avoir des centaines de nœuds, mais à y regarder de plus près, les utilisateurs d'Europe et des États-Unis, d'Asie du Sud-Est et d'Amérique du Sud regardent toujours le film en tournant en rond. De nos jours, même les CDN doivent “empêcher les coéquipiers” - pour empêcher ceux qui ne prennent pas en compte les conditions réelles du réseau du programme de piges.
Un véritable CDN de haute défense avec une couverture mondiale doit être déployé comme un jeu de Go. J'avais l'habitude de diviser le monde en huit régions clés : les côtes Est et Ouest de l'Amérique du Nord, Francfort et Londres en Europe, Singapour en Asie du Sud-Est, Tokyo au Japon, Sao Paulo au Brésil et Sydney en Australie. Chaque région doit déployer au moins deux points POP à haute sécurité et doit prendre en charge le routage BGP anycast. Ne croyez pas ces vendeurs avec une seule ligne de nœuds, les utilisateurs sud-africains accèdent au nœud américain en contournant l'Europe, ce genre d'opération j'ai vu beaucoup.
L'année dernière, nous avons effectué un test comparatif pour la migration d'une plateforme de diffusion en direct. La même chose se passe à Los Angeles pour pousser le flux vers les utilisateurs japonais, l'utilisation d'un CDN traditionnel a atteint une latence moyenne de 380 ms, et a changé pour utiliser CDN5 global intelligent scheduling directement après la pression à 92 ms. La différence clé est : CDN5 dans la liaison du Pacifique est allé à leur propre fibre privée, tandis que la solution traditionnelle est encore crowded public gateway. La transmission vidéo de cette chose, parfois c'est vraiment un jeu de “capacité d'argent” - ne pas vouloir dépenser de l'argent pour construire une ligne dédiée, l'effet est très différent.
La capacité de défense élevée doit être intégrée dans les nœuds périphériques. Une idée fausse très répandue consiste à placer le centre de nettoyage dans la salle des serveurs centraux, à attendre que le trafic contourne le centre et à procéder ensuite au nettoyage. Ma stratégie consiste à faire en sorte que chaque nœud périphérique dispose d'une capacité d'atténuation des attaques DDoS supérieure à 200G. En particulier pour les attaques UDP Flood et CC dans l'industrie vidéo, l'empreinte digitale doit être faite au premier point d'accès.
Il s'agit du modèle de configuration de la protection que nous utilisons sur la plateforme CDN07 :
Une attention particulière doit être accordée au blocage du protocole HTTP1.0/1.1 - de nombreux outils d'attaque sont trop paresseux pour mettre en œuvre le protocole HTTP2, cette astuce permet de bloquer 70 % des attaques CC. Le test a révélé qu'après l'ouverture de la protection adaptative, la consommation du CPU a augmenté de moins de 8%, mais peut résister à des attaques mixtes de 800Gbps, l'affaire est absolument rentable.
La planification intelligente des itinéraires est le véritable obstacle technique. Ne croyez pas aux schémas qui n'assignent les nœuds que sur la base du GeoIP. Le cas le plus scandaleux que j'ai vu est celui d'un utilisateur chilien assigné à un nœud de Miami, et dont la latence, qui devrait théoriquement être de 120 ms, a en fait grimpé à 400 ms - parce que le trafic a emprunté le chemin étrange Chili-Argentine-Brésil-Floride. Notre stratégie est désormais une décision à quatre dimensions :
Il s'agit du fragment central de notre algorithme de décision de routage :
Lors du Double Eleven de l'année dernière, l'activité de diffusion en direct d'une société de commerce électronique transfrontalière s'est appuyée sur cet ensemble d'algorithmes de programmation pour maintenir une latence moyenne inférieure à 120 ms en Asie-Pacifique et inférieure à 80 ms en Europe, malgré un trafic mondial de pointe atteignant 3,2 Tbps. Pour les utilisateurs allemands en particulier, le temps de latence pour obtenir des flux vidéo à partir du nœud de Francfort a été réduit à 43 ms, soit plus rapidement que de nombreux fournisseurs de services locaux.
La stratégie de mise en cache doit correspondre au scénario de l'entreprise. La simple mise en cache de l'intégralité du fichier vidéo est dépassée depuis longtemps. Pour les émissions en direct les plus populaires, nous mettons en pré-cache les 2 à 3 secondes suivantes des tranches vidéo dans le nœud périphérique ; pour le contenu à la demande, nous utilisons la mise en cache segmentée dynamique - en découpant la vidéo en fichiers de 2 secondes et en décidant de la profondeur de la mise en cache en fonction de la chaleur. Les tests montrent que cette solution permet d'économiser 37% de coût de stockage par rapport à la mise en cache d'un fichier complet, tout en garantissant que le temps de la première image est contrôlé dans les 800 ms.
Ne négligez pas l'importance de l'optimisation du protocole. De nombreuses équipes s'en tiennent encore au protocole TCP, mais elles ne savent pas à quel point le protocole QUIC est avantageux pour les transmissions transfrontalières. Nous l'avons testé en Asie du Sud-Est : pour le même flux vidéo, le temps de premier écran de la solution TCP est de 1,8 seconde, alors que QUIC ne prend que 0,9 seconde. En particulier pour les environnements de réseaux sans fil, la poignée de main 0-RTT et le multiplexage de QUIC peuvent considérablement améliorer l'expérience. Toutefois, il convient de noter que QUIC consomme plus de CPU, vous devez donc choisir un nœud qui prend en charge l'accélération matérielle.
Pour être honnête, il n'y a pas de solution miracle pour faire un bon travail d'accélération vidéo globale, et l'essentiel est encore d'accumuler les détails. De la sélection des nœuds au réglage des protocoles, de la protection de la sécurité au contrôle des coûts, chaque lien doit être réglé à l'extrême. Certains clients choisissent de réduire le programme afin d'économiser les coûts 20%, et en conséquence, la perte provoquée par la perte d'utilisateurs dépasse de loin les économies réalisées. Les personnes intelligentes devraient comprendre comment calculer ce compte.
Au cours des trois dernières années, j'ai géré le projet pour vérifier une règle : aucun fournisseur de CDN ne peut faire le meilleur dans toutes les régions. CDN5 est préféré en Amérique du Nord, CDN07 est utilisé en Europe, et 08Host est choisi en Asie-Pacifique, en particulier autour de la Chine - le multi-cloud hybride est la solution ultime. La commutation intelligente entre les différents fournisseurs de services grâce à un planificateur développé par l'entreprise elle-même permet d'atteindre l'objectif d'une latence inférieure à 150 ms partout dans le monde.
Enfin, j'aimerais dire quelque chose d'offensant : ne regardez pas le site web officiel de certains fournisseurs qui vous font miroiter le ciel, mais lorsque vous voulez vraiment tester, n'oubliez pas de leur demander de fournir des données de surveillance provenant de cas réels de clients. J'ai vu trop de cas où les clients ont été trompés par des données idéales provenant du laboratoire. Dans les environnements de réseau réels, la solution triplement optimale qui permet d'obtenir simultanément une faible latence, une protection élevée et un faible coût est le partenaire auquel il convient de faire confiance.

