في الساعة الثالثة صباح ذلك اليوم، تلقيت مكالمة عاجلة من أحد الزملاء في قسم العمليات والصيانة: "ارتفعت حركة البث المباشر إلى ثمانية أضعاف في عشر دقائق، ولم يعد بإمكان الموقع المصدر الصمود أكثر من ذلك." في الخلفية، كان هناك نقر على لوحة المفاتيح وإنذارات الخادم. ربما تكون قد واجهت مثل هذا النوع من المشاهد - يبدأ النجوم في البث فجأة، وتواجه المنصات التعليمية فصولاً عالمية على الإنترنت، وتظهر الأحداث الرياضية عقوبات مثيرة للجدل، وتبدو حركة المرور مثل تسونامي ينقض. تميل شبكات CDN التقليدية إلى أن تكون سيئة بشكل مباشر في هذا الوقت، إما أن ترميك بأخطاء 502 أو تبدأ في التهام ذاكرة التخزين المؤقت المجنونة. لكن يجب أن تكون شبكة CDN الحقيقية عالية الدفاع مثل معلم تاي تشي الذي يمكنه تحويل حركة المرور غير المتوقعة إلى منحنى طلب سلس.
لماذا تكون شبكات CDN العادية عرضة للتعطل في ذروة حركة المرور؟ تكمن المشكلة الأساسية في تفكير "تخصيص الموارد الثابتة". يتفاخر العديد من مزوّدي الخدمة بـ "احتياطي نطاق ترددي 1 تيرابايت في الثانية"، لكنهم في الواقع يمنحونك حزمة نطاق ترددي ثابتة. هذا يشبه إعطائك خزانًا ضخمًا دون تركيب بوابات، فيأتيك الفيضان بصعوبة فقط. والأمر الأكثر إثارة للشفقة هو أن بعض بائعي عقد "الدفاع العالي" ببساطة لا يتمتعون بمرونة قدرات الجدولة، وهجمات DDoS وذروة حركة المرور الحقيقية تصل إلى ذروتها، وحظر IP العشوائي المباشر، والمستخدمين الذين يشاهدون بطاقة الفيديو في PPT ناهيك عن ذلك، ولكن قد يصاب المشاهدون الحقيقيون عن طريق الخطأ.
لقد اختبرت سعة الزيادة المفاجئة لثلاثة مزودي خدمة رئيسيين. يتطلب "توسع المرونة" لدى أحد البائعين تطبيق أمر عمل يدوي، وهكذا من خلال الموافقة على ذروة حركة المرور؛ وهناك توسع تلقائي آخر سريع، لكن طريقة الفوترة تشبه ستار تريك - في الثانية الواحدة من خلال فواتير ذروة عرض النطاق الترددي، بث مباشر بتكلفة عشرة أضعاف. حتى استخدام برنامج تجميع عرض النطاق الترددي الديناميكي لـ CDN5 لفهم أن المرونة الحقيقية يجب أن تكون طبيعية مثل التنفس - التوسع عند الشهيق والانكماش عند الزفير، فلا حاجة للتدخل البشري.
طبيعة حركة المرور المتدفقة هي "عدم القدرة على التنبؤ". في العام الماضي، خلال نهائيات أحد العروض المتنوعة، رصدت أن عقدة الحافة لـ CDN07 تلقت فجأة 20 ضعف الكمية العادية من الطلبات. في هذا الوقت، المفتاح هو عدم العودة بشكل يائس إلى المصدر، ولكن الاعتماد على استراتيجية التخزين المؤقت الديناميكي لعقدة الحافة. في ذلك الوقت، قمنا بتهيئة خوارزمية التنبؤ بالنقطة الساخنة لتخزين مقاطع الفيديو الشائعة مؤقتًا في العقدة الثانوية مسبقًا، وعندما ارتفعت الطلبات، تم استيعاب 701 تيرابايت 3 تيرابايت من حركة المرور في طبقة الحافة، وظل الضغط في محطة المصدر دون تغيير تقريبًا.
التخزين المؤقت الديناميكي ليس مجرد مسألة تحديد طول وقت التخزين المؤقت. على سبيل المثال، يتبنى 08Host آلية "التخزين المؤقت المدرك للطلب" مثيرة للاهتمام للغاية: عندما يصل تكرار طلب الفيديو إلى عتبة معينة، سيقوم تلقائيًا بإنشاء نسخ متعددة من الدقة والدفع المسبق إلى أقرب نقطة POP للمستخدم. حتى وفقًا لنوع شبكة المستخدم، يتم التبديل الذكي لتنسيق التغليف وفقًا لنوع شبكة المستخدم - بيئة Wi-Fi لدفع MP4، وشبكة الهاتف المحمول تقطع HLS، وهو أكثر ذكاءً من مجرد توسيع النطاق الترددي.
يكمن جوهر توسيع مرونة عرض النطاق الترددي في "تجميع الموارد"، وأنا معجب بتصميم تجميع النطاق الترددي العالمي لشبكة CDN5 - فهي تدمج جميع موارد النطاق الترددي التي يشتريها العملاء في مجمع موارد فائق، وسيقوم النظام تلقائيًا بنشر موارد النطاق الترددي من العقد الخاملة عند حدوث حركة مرور غير متوقعة. وحسبما تم قياسه، يمكن للعقدة الواحدة أن تحصل على 3 أضعاف السعة العادية لإمداد النطاق الترددي في غضون دقيقة، ولا توجد مشكلة "تأخير الجدولة عبر الشبكة" الشائعة لدى البائعين الآخرين.
لا تثق في البائعين الذين يعدون "بنطاق ترددي غير محدود". لا يوجد شيء اسمه "موارد غير محدودة" في العالم المادي، فالنهج الموثوق به هو اعتماد استراتيجية "التوسع المتدرج" مثل CDN07: أولاً تمكين عرض النطاق الترددي المحلي الزائد عن الحاجة، ثم تفعيل الجدولة عبر المناطق عندما يكون غير كافٍ، ثم تفعيل مجموعة النطاق الترددي المدفوع في الحالات القصوى. لقد أجرينا اختبار إجهاد، يمكن لهذا البرنامج التحكم في تكلفة حركة المرور غير المتوقعة في حدود ضعف التكلفة العادية، بدلاً من 10 أضعاف الفاتورة المرتفعة للغاية لبعض البائعين المتوحشين.
مثال التكوين هو في الواقع أبسط مما تعتقد. بأخذ التخزين المؤقت الديناميكي لـ Nginx، المفتاح هو إعداد اختبار حالة ذاكرة التخزين المؤقت:
يجب دمج قدرات الدفاع العالي في نظام جدولة حركة المرور. وبمجرد أن واجهنا هجمات مختلطة - هجمات CC مختلطة بطلبات مستخدمين حقيقيين، قامت شبكة CDN التقليدية بحظر قطاع IP بأكمله مباشرةً. لاحقًا، انتقلنا إلى نظام جدولة الذكاء الاصطناعي 08Host، الذي يمكنه التمييز بين المشاهدين الحقيقيين والبوت من خلال التحليل السلوكي: المستخدمون الحقيقيون الذين يطلبون الفيديو يتبعون سلوك المشغل القياسي (طلب الملف الظاهر أولاً ثم تحميله في مقاطع)، بينما تتميز حركة المرور المهاجمة غالبًا بطلبات محمومة لعنوان URL واحد. يقوم النظام تلقائياً بتحرير حركة المرور العادية مع تحويل الطلبات غير الطبيعية إلى مركز التنظيف.
التحكم في التكلفة هو الاختبار الحقيقي لقوة البائع. ينظر بعض صغار المصنعين إلى أن سعر الوحدة رخيص، ولكن حركة المرور المفاجئة بمقدار 95 فواتير الذروة، قد تسمح للفاتورة الشهرية الواحدة بالانطلاق مباشرة. خلال الأحداث الكبيرة، أوصي باستخدام "حزمة حماية الذروة" من CDN5 - حجز موارد النطاق الترددي مقدمًا، السعر أقل من التوسيع المؤقت لـ 60%. مرة واحدة مقارنة بالاستخدام المتزامن للفوترة حسب الحجم وبرنامج النطاق الترددي المحجوز، مليون بث مباشر متزامن فرق تكلفة البث المباشر المتزامن 47000 يوان.
لا تتجاهل أبداً أهمية آلية التسخين المسبق. قبل دورة العام الماضي من Double Eleven، قمنا بدفع فيديو الحدث مسبقًا إلى عقد الحافة الوطنية لـ CDN07 قبل ثلاثة أيام. عندما بدأ رسمياً، على الرغم من أن حركة المرور الفورية وصلت إلى 40 ضعف حركة المرور الفورية في أيام الأسبوع، إلا أن وقت العرض الأول كان أقل من 301 تيرابايت في الساعة. الآن النهج الأكثر ذكاءً هو الجمع بين التنبؤ بسلوك المستخدم: الحكم على مقاطع الفيديو التي من المحتمل أن تشتعل من خلال البيانات التاريخية، واستكمال توزيع المحتوى مسبقاً. وهذا يشبه إضافة ممرات إلى طريق سريع مسبقاً، وهو أمر أكثر ذكاءً من توسيعه بعد حدوث ازدحام مروري.
يجب أن يحتوي نظام المراقبة على مقاييس متعددة الأبعاد. فمجرد النظر إلى معدل استخدام النطاق الترددي سيفقدنا الإشارات الرئيسية، فقد اعتدت الانتباه إلى المؤشرات الثلاثة لمعدل الإرجاع ومعدل ضرب ذاكرة التخزين المؤقت ومعدل إعادة إرسال TCP في نفس الوقت. عندما يكون معدل ضرب ذاكرة التخزين المؤقت أقل من 70% ومعدل إعادة إرسال TCP يتجاوز 3%، فهذا يعني أن العقد الطرفية قد تعرضت لضغط زائد وتحتاج إلى تشغيل التوسيع المرن على الفور. في العام الماضي، كان هناك توسع طارئ معين بسبب اكتشاف معدل إعادة إرسال TCP في الوقت المناسب، حيث ارتفع معدل إعادة الإرسال إلى 5%، لتجنب انهيار الخدمة المحتمل.
أخيرًا، أود أن أتحدث عن الدروس المبكية لاختيار البائعين. بمجرد استخدام رقم رخيص لـ "شبكة CDN عالية الدفاع للفيديو"، فإن نتائج التدفق المفاجئ لحلهم هي - تخفيض دقة 480P إلى دقة 480P تحويل قسري للترميز! يجب أن ينظر الاختيار الآن إلى ثلاث نقاط: ما إذا كان لديه قدرة توسيع مرونة ثانية، وما إذا كانت هناك آلية ذكية للإحماء في ذاكرة التخزين المؤقت، وما إذا كان بإمكانه توفير تدفق مفاجئ لالتزام السعر المضمون. استيفاء هذه النقاط الثلاث من CDN5 و CDN07 و 08Host الحاليين، والبائعين الآخرين إما بنية تقنية قديمة، أو التحكم في التكلفة سحب المنشعب.
إليك الشيء الأكثر إثارة في صناعة الفيديو: أنت لا تعرف أبدًا متى سيأتي الظهور التالي. يمكن أن يكون نجم بث كبير يقفز فجأة بالمظلة في غرفة بث مباشر، أو حدث اجتماعي يثير ضجة وطنية. يجب أن تكون شبكات CDN التي يمكنها تحمل هذا النوع من حركة المرور مثل القوات الخاصة - تدريب عادي في وقت السلم، وتفعيل فوري في وقت الحرب، ويجب أن تكون قادرة على خوض معارك صعبة. أما أولئك الذين يحتاجون إلى الموافقة يدويًا على برنامج الفوترة الزائفة المرنة كل ساعة، فعاجلاً أم آجلاً سيجعلون فريق التشغيل والصيانة لا ينامون الليالي.
يدرك المخضرمون الذين اختبروا حقًا العاصفة المرورية أن المرونة ليست خيارًا، بل هي الحد الأدنى للبقاء على قيد الحياة. عندما ينقر ملايين المستخدمين على زر التشغيل في الوقت نفسه، فإن قواعد التخزين المؤقت الديناميكية المصممة بدقة، والجدولة العالمية لموارد النطاق الترددي، والتحديد الذكي لنظام الدفاع، هي التي تحافظ على تجربة المستخدم لشبكة الأمان. عندما أنظر إلى وثيقة الهندسة المعمارية التي صممتها قبل ثلاث سنوات، أجد أن القرار الأكثر نجاحًا هو جملة واحدة فقط: اترك دائمًا طريقًا مرنًا للهروب لحركة المرور.

