مدونة ديدرون

كيف قدمت شركة Dedrone للتو أسرع وأدق حل لأمن المجال الجوي حتى الآن

ب

Dedrone

تحسنت الخطة المتوسطة المدى لنموذجنا بنسبة 24.3%

بقلم: رافاييل تيرنر (مدير الذكاء الاصطناعي، ديدرون)، أليكس كيميافي (مهندس رؤية حاسوبية، ديدرون)، إيفان ليبيديف (قائد فريق المحاكاة، ديدرون)

المآخذ الرئيسية

  1. قدمت شركة Dedrone اليوم الحل الأسرع والأكثر دقة للتوعية بالمجال الجوي السفلي من خلال الاستفادة من PyTorch وWeights & Biases وH100 من Nvidia لإنشاء نموذج جديد نطلق عليه Pythagoras 1
  2. يجب أن تجتمع ثلاث لبنات أساسية معاً لإنشاء أسرع وأدق حل لأمن المجال الجوي في العالم. وتشمل هذه العناصر الأجهزة وبنية الشبكة العصبية والبيانات. وفي كل حالة، جمعت Dedrone أكثر المكونات المتاحة قدرة.
  3. يمكن تطبيق هذا المحرك الأساسي للحماية من الطائرات بدون طيار غير المصرح بها مع تمكين الطائرات بدون طيار المنتجة من التنقل بأمان في مجال جوي أكثر تعقيداً
  4. لقد حقق نظام Pythagoras 1 بالفعل قفزات هائلة في الأداء بما في ذلك السرعة ودقة الكشف لتحديد الطيور والطائرات المروحية والطائرات بدون طيار رباعية المروحيات والطائرات بدون طيار ذات الأجنحة الثابتة والطائرات.

مقدمة

اليوم، نحن متحمسون لمشاركة الجيل التالي من نماذج الرؤية الحاسوبية (CV) من Dedrone متاحة للاستخدام على نطاق واسع من قبل عملائنا. أطلقنا عليه اسم Pythagoras 1، نسبةً إلى PyTorch، وهو إطار عمل كامل الميزات لبناء نماذج التعلم العميق المستخدمة في Dedrone، وجزئياً نسبةً إلى عالم الرياضيات اليوناني الشهير. يتميز هذا الإصدار بتحسينات في الدقة على جميع فئات الكائنات واسترجاع معظم فئات الكائنات. يتضمن الإصدار أيضاً تحسناً كبيراً في وقت تشغيل النموذج. يعمل هذا النموذج من الجيل التالي الآن على تشغيل جميع منتجات Dedrone، بما في ذلك أحدث حلولنا لحماية الطائرات بدون طيار ذات المستشعرات بالإضافة إلى DedroneBeyond.  

استفاد فريق Dedrone المتخصص في التعلم الآلي من ثلاثة مشغلات أساسية لتقديم واحد من أسرع وأدق حلول أمن المجال الجوي القائمة على دمج أجهزة الاستشعار في العالم.  

أولاً، بدأنا بوحدة معالجة الرسومات المناسبة، وهي H100. من المعروف أن هذه الآلة تقدم أفضل الإمكانات اليوم كآلة تدريب على التعلم الآلي. نحن نمتلك الآن العديد من هذه الآلات وهي تعمل على مدار 24 ساعة يومياً لتحسين حلنا باستمرار.

بعد ذلك، استفدنا من PyTorch كإطار عمل لنماذج الرؤية الحاسوبية لـ DedroneTracker.AI، وشرعنا في بناء أفضل النماذج لأمن المجال الجوي المنخفض مع الحفاظ على أدائنا لمهمة مكافحة الطائرات بدون طيار. لقد أردنا معالجة ملاحظات العملاء بشأن زيادة تقليل معدلات الإنذارات الكاذبة وتحسين قدرتنا على اكتشاف الأجسام الطائرة بما يتجاوز المروحيات الرباعية التقليدية للطائرات بدون طيار. مكنتنا PyTorch من استخدام بنية شبكة عصبية جديدة تماماً. تُعد Pythagoras 1 قفزة كبيرة إلى الأمام وهي حقًا أحدث ما توصلت إليه أجهزة الكشف عن الأجسام في المجال الجوي المنخفض.  

أخيرًا، أخذنا المكتبة الرائعة التي تمتد لسبع سنوات من مجموعات البيانات التي تم إنشاؤها بالفعل وقمنا بتعزيزها أكثر من خلال مجموعات البيانات المحاكاة ودمج التعلم النشط للحالات الأكثر إثارة للاهتمام، وبالتالي قمنا بإدخالها في عملية تدريب النموذج.

ما هي نتائج تحسين الأداء؟

لقد حقق برنامج Pythagoras 1 زيادة في سرعة أداة تعقب الفيديو الخاصة بنا بنسبة 20% في المتوسط، بالإضافة إلى تحسن كبير في الدقة، مما أدى إلى خفض كل من الإيجابيات الخاطئة والسلبيات الخاطئة. يظهر أدناه رسم توضيحي يوضح سيناريوهات تفصيلية للسيناريوهات الخاصة بالإيجابيات الحقيقية والإيجابيات الخاطئة والسلبيات الخاطئة:

يمكن قياس هذه التحسينات من خلال تحسين متوسط الدقة (mAP) ومتوسط الاستعادة (mAR). الاسترجاع والدقة هما المقياسان الرئيسيان المستخدمان لتقييم أداء الكاشف. من الناحية العملية، هناك مفاضلة بين هذين المقياسين. ستؤدي زيادة عتبة تصنيف جسم ما في المجال الجوي إلى تقليل النتائج الإيجابية الخاطئة، وبالتالي تحسين الدقة. ومع ذلك، فإن هذا يميل إلى السماح بمزيد من السلبيات الخاطئة في الممارسة العملية، وبالتالي فإن الاستدعاء الآن أقل. يعمل هذا في كلا الاتجاهين أيضًا. تشرح المعادلتان أدناه هذه المقاييس:

التذكر والدقة

علاوةً على ذلك، نلاحظ تحسناً بمعدل 14 ضعفاً في متوسط الدقة للطائرات المسيرة الصغيرة للغاية. وقد لوحظت هذه التحسينات عبر جميع الأجسام والعديد من المقاييس المكانية. مقاييس الكشف مفصلة في الجداول أدناه:

 

كيف تم تحقيق هذه النتائج؟

الحاجة إلى السرعة: البنية التحتية المنفذة على أعلى مستوى من حيث التنفيذ

تلتزم شركة Dedrone بتحسين حل الذكاء الاصطناعي المتكامل الخاص بنا، وللقيام بذلك بسرعة قمنا بشراء مجموعة حواسيب جديدة بالاستفادة من وحدة معالجة الرسومات الرائدة في مجال الذكاء الاصطناعي (GPU) من NVIDIA، وهي وحدة معالجة الرسومات (H100). لقد عملنا مع Lambda Labs لبناء مجموعة حواسيبنا الجديدة. قللت هذه الأجهزة الجديدة من الوقت الذي يستغرقه تدريب نموذجنا عبر ملايين الإطارات من الفيديو، حيث قمنا بتكييف كود التدريب الخاص بنا لاستخدام وحدات معالجة رسومات متعددة. وهذا بدوره مكّن فريقنا من إجراء التجارب بمعدل أعلى بكثير. تضمنت التجارب المذكورة تعديلات في بنية الشبكة العصبية إلى جانب الضبط الموجه للمعاملات الفائقة. بالإضافة إلى ذلك، تعتمد البنية التحتية للتقييم لدينا على الأوزان والانحيازات، مما يسمح لنا بتصور نتائج نموذجنا بسهولة وفهم المجالات التي يمكننا تحسينها. وعلاوة على ذلك، يأتي نظام Weights & Biases مع إطار عمل لضبط المعلمات الفائقة، وهو نظام Sweeps، والذي يتم تطبيقه على كل بنية نقوم بتدريبها.

بنية الشبكة العصبية الجديدة

Pythagoras 1 هو ترقية كاملة من نموذجنا السابق، حيث يستفيد من بنية الشبكة العصبية الجديدة وإطار التدريب وإطار النشر. تسمح بنية الشبكة العصبية بربط الميزات بسهولة أكبر وتتخلص من بعض الافتراضات التي تضعها أجهزة الكشف الأخرى التي يمكن أن تربك الشبكة. إطار التدريب أقوى بكثير من إطار عملنا السابق، مما يسمح لنا بوضع نموذج أولي سريع وتجربة أفكار جديدة. يقلل محرك الاستدلال الجديد الذي نستخدمه بشكل كبير من الوقت الذي يستغرقه نموذجنا للتنفيذ على مقطع فيديو، وهذا بدوره يسمح لنا بالاستفادة من المزيد من "الخلايا العصبية" في شبكتنا العصبية بتكلفة مماثلة للإطارات في الثانية مقارنةً بنموذجنا السابق. بالإضافة إلى ذلك، يمكن للشبكة الاستفادة من عدد أكبر من وحدات البكسل من المعلومات دون أن تتأثر كثيراً في وقت التشغيل بالمقارنة مع طريقة النشر السابقة. وقد مكننا هذا التغيير من معالجة واستنتاج ما هو موجود في الفيديو بدقة 4k بسرعة، مما يتيح لنا أن نكون مستعدين لتحديات الوعي بالمجال الجوي الجديدة مثل الطائرات بدون طيار كمستجيب أول (DFR).

الأمر كله يتعلق بالبيانات: البيانات الجيدة تتفوق على المزيد من البيانات

في التعلم الآلي، البيانات هي كل شيء. فالبيانات الجيدة يمكن أن تعزز أداء النموذج بشكل كبير، في حين أن البيانات الرديئة يمكن أن تؤدي إلى نتائج دون المستوى الأمثل، بغض النظر عن مدى تعقيد النموذج. يتجسد هذا المفهوم في القول المأثور:

"البيانات الجيدة تتفوق على المزيد من البيانات."

بدأت رحلتنا بمجموعة بيانات أساسية مع توزيع الأجسام الظاهر في الصورة أدناه. تم جمع البيانات من مجموعة متنوعة من المواقع، ولكنها احتوت في الغالب على طائرات بدون طيار. تم وضع تعليقات توضيحية لهذه الإطارات باستخدام أداة Dedrone الداخلية، مما شكل أساس مجموعة بيانات التدريب الخاصة بنا. لتحسين أداء ما يمكن أن يحققه نموذجنا، كنا بحاجة إلى تنويع وتحسين جودة بياناتنا. وقد قادنا فهمنا لنقص ثراء مجموعة بياناتنا إلى اعتماد العديد من الأساليب المبتكرة لتنظيم البيانات وتنقيحها، والتي سنناقشها في الأقسام التالية.

مجموعة بيانات ديدرون الأولية

تنظيم البيانات وإتقانها (DCAP)

تتمثل إحدى استراتيجياتنا الرئيسية لتحسين جودة البيانات في دمج التعلّم النشط في عملية تدريب النموذج. ينطوي التعلّم النشط على اختيار نقاط البيانات الأكثر إفادة بذكاء للتعليق التوضيحي وبالتالي تحسين أداء النموذج بعدد أقل من عينات البيانات.

DCAP من خلال التعلم النشط

تتضمن حلقة التعلم النشط الخاصة بنا تحديد الحالات الفاشلة بما في ذلك التنبيهات الخاطئة والتصنيفات غير الصحيحة والاكتشافات الفائتة بما في ذلك الحالات التي تحتوي على عدة أجسام في المشهد. كانت الحالات الفاشلة حاسمة لفهم المجالات التي يحتاج نظامنا إلى تحسينها.

وتستمر منهجية التحسين هذه اليوم؛ فمن خلال البحث بنشاط عن الحالات الفاشلة، يمكننا تنظيم مجموعة بيانات تدريبية أكثر شمولاً وفعالية. يتم إرسال الحالات الفاشلة التي تم تحديدها إلى شركة تعليلية خارجية للحصول على شرح شامل وضمان الجودة. وبمجرد اكتمال هذه العملية، يتم دمج البيانات الجديدة في مجموعة التدريب الخاصة بنا، وتكون جاهزة للتكرار التالي للتعلم النشط. تضمن هذه العملية التكرارية التحسين المستمر في أداء نموذجنا. لقد أضفنا مؤخراً 2 مليون صورة إضافية مشروحة من خلال هذه المنهجية.

البيانات الاصطناعية

تُعد البيانات الاصطناعية أمرًا بالغ الأهمية في التعلم الآلي والسيرة الذاتية لأنها تساعد على سد الثغرات في مجموعات البيانات الواقعية، وتعزز التنوع، وتوازن توزيعات الفئات. من خلال توليد صور اصطناعية، يمكننا محاكاة سيناريوهات مختلفة، وزيادة البيانات الموجودة، وإنشاء حالات صعبة تحسّن من متانة النموذج ودقته. يصبح هذا الأمر أكثر أهمية عندما تكون البيانات الحقيقية نادرة أو يصعب الحصول عليها.

لذلك، لتحسين مجموعة بيانات Dedrone بشكل أكبر، نستخدم تقنيات زيادة البيانات باستخدام أداة AutoKat الخاصة بنا. تعمل AutoKat على زيادة الصور الموجودة من خلال طلاء الأجسام الاصطناعية فيها، سواءً مع أو بدون التعليقات التوضيحية الموجودة. بالنسبة لهذا المشروع، حصلنا على نماذج مختلفة، بما في ذلك 21 طائرة هليكوبتر و7 طائرات و11 طائرة بدون طيار (بما في ذلك طائرات رباعية المروحيات وطائرات بدون طيار ثابتة الجناحين وحتى ثلاث طائرات بدون طيار من المجموعة 3)، والتي يمكن تحجيمها وتوجيهها ووضعها في أي موضع داخل الصورة.

تسمح لنا هذه الطريقة بإنشاء مجموعة متنوعة من الصور، وهي مفيدة بشكل خاص لموازنة مجموعة بياناتنا من خلال توليد العديد من التعليقات التوضيحية للطائرات المروحية والمستويات. كما أنها تساعد في معالجة توزيع أحجام الأجسام، وهو أمر بالغ الأهمية لتطوير نماذجنا للعمل مع صور بدقة 4K. على الرغم من أن الصور التي يتم إنشاؤها بواسطة AutoKat قد لا تلتقط بشكل كامل الضوضاء والإضاءة والحدة في صور العالم الحقيقي، إلا أنها تساهم بشكل كبير في تحسين مجموعة بياناتنا. فيما يلي بعض الأمثلة على الصور الموسعة لمشروع Pythagoras 1.

أمثلة على صور AutoKat
أمثلة على صور AutoKat

هناك نهج واعد آخر يتمثل في توليد صور اصطناعية بالكامل باستخدام بيئات وأشياء محاكاة. يعمل فريق المحاكاة لدينا على إنشاء صور واقعية حيث يتم عرض كل شيء معًا، مما يوفر معلومات شاملة عن الحقيقة الأرضية. توفر بيئات المحاكاة المرونة اللازمة لتجربة مختلف ظروف الإضاءة وسيناريوهات الطقس والمواقف الفريدة التي يصعب تكرارها في الحياة الواقعية، مثل الطائرات بدون طيار التي تحلق فوق المدن. يكمن التحدي الرئيسي في مطابقة تكوينات المستشعرات والعدسات المحاكاة مع تلك المستخدمة في الحياة الواقعية. وعلى الرغم من هذه الصعوبة، فإننا نعتقد أن نهج البيانات المحاكاة هذا سيعزز أداء نموذجنا في المستقبل. فيما يلي بعض الصور التي تعرض عالم المحاكاة الذي طورناه. لا يزال هذا النهج قيد التطوير وسيتم استخدامه في مراحل أخرى من تحسين نموذج فيثاغورس 1.

أمثلة على الصور المحاكاة
أمثلة على الصور المحاكاة

البيانات هي ما يبعث الحياة في أي نموذج للتعلم الآلي. فمع البيانات الزائدة عن الحاجة، أو البيانات الرديئة، قد يتعلم النموذج سلوكًا غير مرغوب فيه أو قد لا يعمم على الحالات غير المرئية بشكل جيد. من خلال عملية الاجتثاث التي أجريناها حددنا عمليات تعزيز البيانات الرئيسية التي حسّنت نموذجنا. من الصعب أيضًا جمع البيانات التي يستفيد منها نموذجنا مثل الطائرات والمروحيات على مسافة بعيدة جدًا من الكاميرا. ولمراعاة ذلك في مجموعة بياناتنا، تمكن فريق المحاكاة من توليد بيانات اصطناعية. جمع فريق تنظيم البيانات وإتقانها (DCAP) التابع لشركة Dedrone بيانات مرغوبة ومتنوعة يمكن تدريب Pythagoras عليها، ولا يزال يقدمها. وتستمر هذه التحسينات المستمرة في بياناتنا في تعزيز التحسن في أداء برنامج Pythagoras.

نتيجة

بعد أن قمنا بتحسين بنية شبكتنا العصبية، وحسّنا المعلمات الفائقة، واستأصلنا البيانات، وملأنا الفجوات ببيانات محاكاة. تحسنت mAP لنموذجنا بنسبة 24.3%!

ما الذي تتوقعه بعد ذلك من ديدرون

تتمثل رؤيتنا في اكتشاف وتتبع وتصنيف كل جسم طائر في السماء. مع Pythagoras 1، خطونا خطوة كبيرة نحو تحقيق هذا الهدف. يقدم Pythagoras 1 الحل الأسرع والأكثر دقة في العالم للتوعية بالمجال الجوي المنخفض ومكافحة الأنظمة الجوية المضادة للطائرات بدون طيار من خلال الاستفادة من أسرع تقنيات المعالجة وأحدث ما توصلت إليه أبحاث وتطوير نماذج التعلم الآلي ودعم فريق قوي لتنظيم البيانات وإتقانها ومحاكاتها. نحن ملتزمون بمواصلة نمو وتطوير Pythagoras 1 وسنقوم بإصدار إصدارات حرارية قريباً.

نشر

17 يوليو 2024

| تحديث

10 أغسطس 2024

نبذة عن الكاتب

فريق تسويق Dedrone مسؤول عن مشاركة أخبار الدفاع عن الطائرات بدون طيار والتحديثات والحلول مع المنظمات في جميع أنحاء العالم.