تحسين النماذج الخوارزمية من أجل الذكاء الاصطناعي منخفض الطاقة في الهوامش لعام 2025: ديناميكيات السوق، والاختراقات التكنولوجية، والتوقعات الاستراتيجية حتى عام 2030. استكشف الاتجاهات الرئيسية، والجهات الرائدة في المناطق، وفرص النمو في الذكاء المحيطي.
- الملخص التنفيذي ونظرة عامة على السوق
- الاتجاهات التكنولوجية الرئيسية في تحسين الذكاء الاصطناعي منخفض الطاقة على الحافة
- المشهد التنافسي: الشركات الرائدة والمبتكرون الناشئون
- توقعات نمو السوق (2025–2030): معدل النمو السنوي المركب، توقعات الإيرادات، ومعدلات التبني
- التحليل الإقليمي: أمريكا الشمالية، أوروبا، آسيا والمحيط الهادئ، وبقية العالم
- التحديات والفرص: العوائق والممكنات ونقاط الاستثمار الساخنة
- نظرة مستقبلية: توصيات استراتيجية وتطورات الذكاء الاصطناعي من الجيل التالي على الحافة
- المصادر والمراجع
الملخص التنفيذي ونظرة عامة على السوق
يشير تحسين النماذج الخوارزمية للذكاء الاصطناعي المنخفض الطاقة على الحافة إلى مجموعة من التقنيات والأدوات المصممة لتعزيز الكفاءة، السرعة، والدقة لنماذج الذكاء الاصطناعي (AI) التي تم نشرها على أجهزة الحافة ذات الموارد الحاسوبية والطاقة المحدودة. مع تسارع انتشار أجهزة إنترنت الأشياء (IoT)، ومستشعرات ذكية، وأنظمة مدمجة، زاد الطلب على استنتاج AI على الحافة—بدلاً من مراكز البيانات السحابية المركزية. يقود هذا التحول المتطلبات للمعالجة في الوقت الحقيقي، وخصوصية البيانات، وتقليل التأخير، واستهلاك النقل المنخفض.
من المتوقع أن يصل السوق العالمي لأجهزة وبرمجيات الذكاء الاصطناعي على الحافة إلى 6.7 مليار دولار بحلول عام 2025، مع نمو بمعدل نمو سنوي مركب يبلغ 20.6% من عام 2020، وفقًا لـ MarketsandMarkets. في هذا النظام البيئي، يُعد تحسين النموذج الخوارزمي ممكّنًا حيويًا، مما يسمح بتشغيل الأحمال المعقدة للذكاء الاصطناعي—مثل رؤية الكمبيوتر، والتعرف على الصوت، واكتشاف الشذوذ—بكفاءة على أجهزة تتراوح من الهواتف الذكية والأجهزة القابلة للارتداء إلى وحدات التحكم الصناعية والمركبات المستقلة.
تشمل استراتيجيات التحسين الرئيسية تقنيات مثل تقليل الحجم (quantization)، وتقليم النماذج (pruning)، واستخراج المعرفة (knowledge distillation)، والبحث في البناء العصبي (neural architecture search). تقلل هذه الأساليب من حجم النموذج، وبصمة الذاكرة، ومتطلبات الحوسبة، مما يجعل من الممكن نشر الذكاء الاصطناعي المتطور على وحدات التحكم الدقيقة ومنصات منخفضة الطاقة الأخرى. قدم مقدمو التكنولوجيا الرائدون مثل Arm، Qualcomm، و NVIDIA أدوات مخصصة ومجموعات تطوير برمجيات (SDKs) لتسهيل هذه التحسينات، بينما يتم اعتماد الأطر المفتوحة المصدر مثل TensorFlow Lite و PyTorch Mobile على نطاق واسع لنشرها على الحافة.
علاوة على ذلك، يتم دفع السوق من خلال التقدم في الأجهزة على الحافة، بما في ذلك المسرّعات الذكية و وحدات المعالجة العصبية المتخصصة (NPUs)، والتي تكمل التحسينات الخوارزمية. تعتبر قطاعات مثل التصنيع الذكي، والرعاية الصحية، والصناعات السيارات، والإلكترونيات الاستهلاكية هي الأكثر تقدمًا في التبني، حيث تستفيد من النماذج المحسّنة لتمكين الصيانة التنبؤية، والتشخيصات في الوقت الحقيقي، والتنقل المستقل، وتجارب المستخدمين الشخصية.
باختصار، يُعد تحسين النماذج الخوارزمية للذكاء الاصطناعي المنخفض الطاقة على الحافة تكنولوجيا أساسية تدعم الجيل التالي من الأجهزة الذكية المتصلة. مع توسيع تطبيقات الذكاء الاصطناعي على الحافة وتطور قدرات الأجهزة، ستستمر أهمية تحسين النماذج بشكل فعال وقابل للتوسع وموثوق في النمو، مما يشكل المشهد التنافسي حتى عام 2025 وما بعده.
الاتجاهات التكنولوجية الرئيسية في تحسين الذكاء الاصطناعي منخفض الطاقة على الحافة
يُعد تحسين النماذج الخوارزمية في طليعة تمكين الذكاء الاصطناعي المنخفض الطاقة على الحافة بكفاءة في عام 2025. مع الطلب المتزايد على الذكاء في الوقت الحقيقي في أجهزة الحافة—from الكاميرات الذكية إلى المستشعرات الصناعية—توجه التركيز إلى التقنيات المتقدمة التي تقلل من حجم النموذج، وبصمة الذاكرة، ومتطلبات الحوسبة دون التضحية بالدقة.
أحد الاتجاهات الأكثر أهمية هو الانتشار الواسع لـ تقليل الحجم (quantization)، حيث يتم تمثيل أوزان الشبكات العصبية والتنشيطات باستخدام أنواع بيانات ذات دقة أدنى (مثل INT8 أو حتى التنسيقات الثنائية/الثلاثية). يقلل هذا من استهلاك الذاكرة وعدد العمليات الحسابية المطلوبة، مما يؤدي مباشرة إلى استهلاك طاقة أقل. قامت الشركات الرائدة في صناعة الشرائح ومقدمي منصات الذكاء الاصطناعي، بما في ذلك Arm و Qualcomm، بدمج التدريب والاختبار الواعي بتقليل الحجم ضمن أدواتها، مما يمكّن المطورين من نشر نماذج فعالة للغاية على الأجهزة ذات الموارد المحدودة.
اتجاه آخر رئيسي هو تقليم النماذج (pruning)، والذي ينطوي على إزالة الأوزان والعُقد غير الضرورية أو الأقل أهمية من الشبكات العصبية. يكتسب تقليم النماذج المنظم، بشكل خاص، زخماً بسبب قدرته على إنشاء نماذج متفرقة تكون أكثر ملاءمة للتسريع عبر الأجهزة. وفقًا لـ Gartner، يمكن أن يقلل تقليم النماذج المنظم من حجم النموذج بنسبة تصل إلى 80% في بعض التطبيقات مثل رؤية الكمبيوتر والتعرف على الكلام، مع تأثير ضئيل على الدقة.
استخراج المعرفة (knowledge distillation) تُستخدم أيضًا لنقل قدرات النماذج الكبيرة والمعقدة (المعلمين) إلى نماذج أصغر وأكثر كفاءة (الطلاب). تعتبر هذه المقاربة ذات قيمة خاصة للذكاء الاصطناعي على الحافة، حيث إن نشر النماذج الكبيرة غير عملي. أفادت شركات مثل NVIDIA و Google بنجاح في استخدام استخراج المعرفة للحفاظ على دقة استنتاج عالية على أجهزة الحافة بينما تقلل بشكل كبير من أعباء الحوسبة.
- يتم استخدام البحث الآلي في هيكل الشبكات العصبية (NAS) لاكتشاف بنى النماذج المحسنة للأجهزة المخصصة، مما يوازن بين الدقة، والتأخير، واستهلاك الطاقة.
- يتم استكشاف تقنيات ناشئة مثل الاستنتاج الديناميكي—حيث تتكيف تعقيد النموذج مع بيانات الإدخال—لتحسين كفاءة الطاقة في التطبيقات في الوقت الحقيقي.
من المتوقع أن تدفع هذه التطورات الخوارزمية، بالتوازي مع التعاون بين البرمجيات والأجهزة، الموجة التالية من نشر الذكاء الاصطناعي منخفض الطاقة على الحافة، كما تم تسليط الضوء عليه في تحليلات حديثة بواسطة IDC و ABI Research.
المشهد التنافسي: الشركات الرائدة والمبتكرون الناشئون
يستمر المشهد التنافسي لتحسين النماذج الخوارزمية في الذكاء الاصطناعي المنخفض الطاقة على الحافة في التطور بسرعة، مدفوعًا بانتشار أجهزة الحافة والطلب على استنتاجات الذكاء الاصطناعي في الوقت الحقيقي وكفاءة الطاقة. تستفيد الشركات الرائدة في هذا المجال من تقنيات متقدمة مثل تقليل الحجم، وتقليم النماذج، واستخراج المعرفة، والبحث في هيكل الشبكات العصبية (NAS) لتقليل حجم النماذج ومتطلبات الحوسبة دون التضحية بالدقة.
من بين عمالقة التكنولوجيا المعروفة، تستمر NVIDIA في تحديد المعايير مع أدوات TensorRT و DeepStream SDK، التي تقدم خطوط أنابيب قوية لتحسين النماذج مصممة لنشرها على أجهزة Jetson. تعتبر Qualcomm لاعبًا رئيسيًا آخر، حيث تدمج تحسين نماذج الذكاء الاصطناعي في منصات Snapdragon من خلال مجموعة أدوات كفاءة نماذج الذكاء الاصطناعي (AIMET)، مما يمكّن استنتاجًا فعالًا على الأجهزة للهواتف الذكية، والإنترنت، وتطبيقات السيارات.
في مجال أشباه الموصلات، توفر وحدات معالجة Arm NN SDK و Ethos-N من Arm مجموعة شاملة لتحسين الشبكات العصبية لمعالجات الحافة المنخفضة الطاقة، بينما لا يزال صندوق أدوات OpenVINO من Intel خيارًا شائعًا لتحسين النماذج عبر منصات متعددة، دعمًا لمجموعة واسعة من الأجهزة على الحافة.
تقوم الشركات الناشئة أيضًا بإحراز تقدم كبير. حققت Edge Impulse تقدمًا مع منصتها من البداية إلى النهاية لتطوير وتحسين نماذج tinyML، مستهدفة وحدات التحكم والأجهزة ذات الموارد المحدودة. تركز Latent AI على ضغط نماذج الذكاء الاصطناعي التكيفية وتحسين الأداء الزمني، مع التركيز على الأحمال الديناميكية وبيئات الحافة المتنوعة. تستفيد DeepCortex و OctoML من التعلم الآلي الآلي (AutoML) والتحسينات المستندة إلى المترجم لتبسيط النشر عبر أجهزة الحافة المتنوعة.
- NVIDIA: TensorRT، DeepStream SDK
- Qualcomm: AIMET، Snapdragon AI
- Arm: Ethos-N، Arm NN SDK
- Intel: OpenVINO
- Edge Impulse: تحسين tinyML
- Latent AI: ضغط النماذج التكيفية
- DeepCortex: AutoML للحافة
- OctoML: تحسين قائم على المترجم
اعتبارًا من عام 2025، يتميز السوق بتعاون قوي بين بائعي الأجهزة والبرمجيات، مع التركيز المتزايد على الأطر المفتوحة المصدر والتشغيل البيني. يعتمد الحافة التنافسية بشكل متزايد على القابلية لتقديم نماذج عالية التحسين، غير معتمدة على أجهزة معينة، يمكن نشرها بسرعة عبر نظام بيئي متقطع للحافة.
توقعات نمو السوق (2025–2030): معدل النمو السنوي المركب، توقعات الإيرادات، ومعدلات التبني
من المتوقع أن ينمو سوق تحسين النماذج الخوارزمية المخصص للذكاء الاصطناعي منخفض الطاقة على الحافة بشكل قوي بين عامي 2025 و2030، مدفوعًا بانتشار أجهزة الحافة في قطاعات مثل السيارات، والرعاية الصحية، والأتمتة الصناعية، والإلكترونيات الاستهلاكية. وفقًا لتوقعات Gartner، من المتوقع أن تحقق سوق برامج الذكاء الاصطناعي العالمية على الحافة—بما في ذلك حلول تحسين النماذج—معدل نمو سنوي مركب (CAGR) يبلغ حوالي 22% خلال هذه الفترة، متجاوزة سوق الذكاء الاصطناعي الأوسع بسبب الطلبات الفريدة لنشر الذكاء الاصطناعي على الحافة.
تشير توقعات الإيرادات إلى أن سوق أدوات ومنصات تحسين النماذج سيصل إلى أكثر من 3.5 مليار دولار بحلول عام 2030، مرتفعًا من تقدير يبلغ 1.1 مليار دولار في عام 2025. يُستند هذا النمو إلى زيادة استخدام تقنيات تقليل الحجم وتقليم النماذج واستخراج المعرفة والبحث في هيكل الشبكات العصبية (NAS)، والتي تعد ضرورية لنشر نماذج الذكاء الاصطناعي على الأجهزة المحدودة الموارد. تفيد IDC بأن أكثر من 60% من نشرات الذكاء الاصطناعي الجديدة على الحافة في عام 2025 ستضم شكلًا ما من تحسين النموذج، مع توقع ارتفاع هذه النسبة إلى أكثر من 80% بحلول عام 2030 حيث تسعى المؤسسات لتحقيق توازن بين دقة الاستدلال وكفاءة الطاقة ومتطلبات التأخير.
تُعتبر معدلات التبني مرتفعة بشكل خاص في الصناعات التي يكون فيها اتخاذ القرارات الفورية وكفاءة الطاقة أمرين حيويين. على سبيل المثال، من المتوقع أن تستحوذ صناعة السيارات—المدفوعة بأنظمة مساعدة السائق المتقدمة (ADAS) والمركبات المستقلة—على حوالي 30% من إجمالي الإنفاق على تحسين الذكاء الاصطناعي على الحافة بحلول عام 2030، وفقًا لـ ABI Research. وبالمثل، يُتوقع أن تشهد صناعة الرعاية الصحية معدل نمو سنوي مركب يبلغ 25% في استخدام نماذج الذكاء الاصطناعي المحسنة لتطبيقات مثل التشخيصات المحمولة ورصد المرضى عن بُعد.
- الاتجاهات الإقليمية: من المتوقع أن تقود أمريكا الشمالية وآسيا والمحيط الهادئ في كل من الإيرادات ومعدلات التبني، مع تلاقي أوروبا عن كثب. من المتوقع أن تشهد منطقة آسيا والمحيط الهادئ النمو الأسرع، مدفوعة بنشر الإنترنت من الجيل الخامس (5G) ومبادرات حكومية تدعم الابتكار في الذكاء الاصطناعي (McKinsey & Company).
- محركات التكنولوجيا: من المتوقع أن تسارع التقدم في تحسين النماذج المعتمدة على الأجهزة ودمج أدوات التعلم الآلي الآلي (AutoML) من النمو في السوق، مما يمكّن الاستخدام الأوسع عبر المؤسسات المتوسطة وصانعي أجهزة الحافة.
باختصار، سيشهد الفترة من 2025 إلى 2030 انتقال تحسين النموذج الخوارزمي للذكاء الاصطناعي المنخفض الطاقة على الحافة من قدرة متخصصة إلى متطلب سائد، مع نمو قوي في الإيرادات، ومعدلات تبني عالية، وزخم إقليمي وقطاعي كبير.
التحليل الإقليمي: أمريكا الشمالية، أوروبا، آسيا والمحيط الهادئ، وبقية العالم
يعتمد المشهد الإقليمي لتحسين النماذج الخوارزمية للذكاء الاصطناعي المنخفض الطاقة على الحافة على مستويات متفاوتة من النضج التكنولوجي، والاستثمار، وتركيز التطبيقات عبر أمريكا الشمالية، وأوروبا، وآسيا والمحيط الهادئ، وبقية العالم. من المتوقع أن تؤثر هذه الاختلافات في عام 2025 على كل من سرعة الابتكار وتبني نماذج الذكاء الاصطناعي المحسنة على الحافة.
- أمريكا الشمالية: تظل المنطقة في المقدمة، مدفوعة بنظم البحث والتطوير القوية واستثمارات كبيرة من شركات التكنولوجيا الرائدة مثل NVIDIA و Qualcomm. يؤدي انتشار أجهزة IoT في قطاعات مثل الرعاية الصحية، والسيارات، والمدن الذكية إلى زيادة الطلب على نماذج الذكاء الاصطناعي المنخفضة الطاقة والفعالة. كما تقوم مؤسسات البحث والبدء في أمريكا الشمالية بتطوير تقنيات مثل البحث في هيكل الشبكات العصبية (NAS) والتدريب الذي يراعي تقليل الحجم، التي تُعتبر حاسمة لتحسين النماذج من أجل النشر على الحافة. وفقًا لـ IDC، من المتوقع أن تمثل الولايات المتحدة أكثر من 35% من الإنفاق العالمي على الذكاء الاصطناعي على الحافة في عام 2025.
- أوروبا: تركز أوروبا على كفاءة الطاقة والامتثال التنظيمي، حيث تؤثر مبادرات مثل الصفقة الخضراء الأوروبية على تطوير الذكاء الاصطناعي. تعمل شركات مثل Arm و STMicroelectronics على تعزيز تقنيات ضغط النماذج وتقليمها لتلبية متطلبات الطاقة والخصوصية الصارمة. إن التركيز المتزايد في المنطقة على الذكاء الاصطناعي في الأتمتة الصناعية والبنية التحتية الذكية يؤدي إلى تعزيز التعاون بين الأكاديميا والصناعة، كما تم تسليط الضوء عليه في تقارير Gartner.
- آسيا والمحيط الهادئ: تسارع الحضرنة والتوسع في شبكات الجيل الخامس (5G) في آسيا والمحيط الهادئ يؤدي إلى تسريع تبني الذكاء الاصطناعي على الحافة. تستثمر الشركات الكبرى مثل Samsung Electronics و Huawei في بنى نماذج خفيفة وتصميم برمجي-هارد وير من أجل تمكين استنتاج في الوقت الحقيقي على الأجهزة ذات الموارد المحدودة. كما تشهد المنطقة أيضًا مبادرات مدعومة حكوميًّا لتشجيع الابتكار في الذكاء الاصطناعي، خاصة في الصين وكوريا الجنوبية واليابان. Mordor Intelligence تتوقع أن تكون منطقة آسيا والمحيط الهادئ أسرع الأسواق نمواً في تحسين الذكاء الاصطناعي على الحافة حتى عام 2025.
- بقية العالم: في حين أن التبني يسير ببطء، تستفيد الأسواق الناشئة في أمريكا اللاتينية والشرق الأوسط وأفريقيا من الأطر المفتوحة المصدر وحلول الهجين السحابية-الحافة لسد الفجوات التحتية. تركز الشركات الناشئة المحلية على استراتيجيات تحسين النماذج الاقتصادية، وغالبًا ما تُخصص لحالات استخدام محددة مثل الزراعة والسلامة العامة. من المتوقع أن تلعب شراكات دولية ونقل التكنولوجيا دورًا رئيسيًا في تسريع القدرات الإقليمية، كما أشار إليه الاتحاد الدولي للاتصالات (ITU).
التحديات والفرص: العوائق والممكنات ونقاط الاستثمار الساخنة
يواجه تحسين النماذج الخوارزمية للذكاء الاصطناعي المنخفض الطاقة على الحافة في عام 2025 مشهدًا معقدًا من التحديات والفرص، التي تتشكل بواسطة التقدم السريع في الأجهزة، وتطور حالات الاستخدام، وتغير أولويات الاستثمار. تشمل الحواجز الأساسية المقايضة الجوهرية بين دقة النموذج وكفاءة الحوسبة، وتنوع الأجهزة على الحافة، ونقص أدوات موحدة للنشر. تم تصميم العديد من نماذج الذكاء الاصطناعي الحديثة لتناسب الموارد السحابية، مما يجعل نشرها مباشرة على أجهزة الحافة، مثل وحدات التحكم الدقيقة، ومستشعرات إنترنت الأشياء، والأجهزة المحمولة، غير عملي دون تحسين كبير.
تُعتبر التحديات الفنية الرئيسية في تقليل الحجم وتقليم النماذج: تقليل حجم النموذج وتعقيده دون التضحية بالأداء. على الرغم من نضوج تقنيات مثل التدريب الذي يراعي تقليل الحجم والتقليم المنظم، تختلف فعاليتها على نطاق واسع عبر بنى الشبكات العصبية المختلفة ودوائر التطبيق. علاوة على ذلك، يتطلب تنوع الأجهزة على الحافة—from وحدات معالجة ARM Cortex-M إلى NPUs المتخصصة—استراتيجيات تحسين مخصصة، مما يعقد خط أنابيب التطوير ويزيد من الوقت حتى السوق. تزيد عدم وجود أطر موحدة ومعايير من تفاقم مشكلات التكامل والتشغيل البيني، كما أبرزت Gartner و IDC.
على جانب الفرص، تسهم عدة ممكنات في تسريع التقدم. إن تكاثر أدوات تحسين مفتوحة المصدر—مثل TensorFlow Lite، و ONNX Runtime، و Apache TVM—قد ساعد على تحسين الوصول إلى تقنيات ضغط النموذج والتسريع المتقدمة. توفر بائعي الأجهزة، بما في ذلك Arm و NXP Semiconductors، مجموعة متزايدة من مجموعات تطوير البرمجيات وتصاميم مرجعية مُحسنة لمنصاتهم، مما يقلل من الحواجز أمام المطورين. علاوة على ذلك، فإن ظهور أدوات البحث الآلي في هيكل الشبكات العصبية (NAS) والمترجمات الخاصة بالتعلم الآلي يمكّن من إنشاء نماذج مصممة خصيصًا لتحمل قيود معينة في الحافة، كما أشار إليه McKinsey & Company.
- نقاط الاستثمار الساخنة: وفقًا لـ CB Insights، يتدفق رأس المال الاستثماري إلى الشركات الناشئة التي تركز على تحسين نماذج الذكاء الاصطناعي على الحافة، خاصة تلك التي تستفيد من التصميم التعاوني بين الأجهزة والبرامج وضغط النموذج الآلي. تشهد قطاعات مثل التصنيع الذكي، والسيارات (ADAS)، والأجهزة القابلة للارتداء في الرعاية الصحية استثمارًا كبيرًا بسبب متطلباتها الصارمة للطاقة والتأخير.
- التركيز الإقليمي: تظل أمريكا الشمالية وشرق آسيا تتصدران في كلاً من البحث والتطوير والتسويق، مدفوعين بأنظمة أشباه الموصلات القوية ومبادرات الذكاء الاصطناعي المدعومة حكوميًا، كما أبلغت عنه Statista.
باختصار، بينما يواجه تحسين النماذج الخوارزمية للذكاء الاصطناعي المنخفض الطاقة على الحافة في عام 2025 تحديات فنية وتفكيك نظام بيئي، يتم دفعه في الوقت نفسه من خلال الابتكارات المفتوحة المصدر، والتعاون بين البرمجيات والأجهزة، والاستثمار المستهدف في القطاعات ذات النمو العالي.
نظرة مستقبلية: توصيات استراتيجية وتطورات الذكاء الاصطناعي من الجيل التالي على الحافة
مقرر أن يلعب تحسين النماذج الخوارزمية دورًا محوريًا في تطور الذكاء الاصطناعي المنخفض الطاقة على الحافة بحلول عام 2025، حيث يستمر الطلب على الذكاء في الوقت الحقيقي، على الأجهزة في الازدياد عبر قطاعات مثل السيارات، وإنترنت الأشياء الصناعي، والإلكترونيات الاستهلاكية. تُشكل التوقعات المستقبلية لهذا المجال تلاقي تقنيات الضغط المتقدمة، والبحث في هيكل الشبكات العصبية (NAS)، وتصميم النماذج المعتمدة على الأجهزة، جميعها تهدف إلى تحقيق أقصى استفادة من الأداء في ظل قيود الطاقة والذاكرة الصارمة.
استراتيجيًا، يجب على المؤسسات أن تعطي الأولوية لتبني تقنيات تقليل الحجم، وتقليم النماذج، واستخراج المعرفة لتقليل حجم النموذج ومتطلبات الحوسبة دون التضحية بالدقة. على سبيل المثال، يمكن أن يؤدي تقليل الحجم—الذي يقوم بتحويل أوزان النموذج من دقة 32-بت العائمة إلى تنسيقات ذات دقة أقل—إلى تقليل بما يصل إلى 4x في بصمة الذاكرة وتوفير كبير في الطاقة، كما تم إثباته في تقييمات حديثة من Arm و Qualcomm. كما أن تقليم النماذج، الذي يلغي المعلمات الزائدة، واستخراج المعرفة، حيث تتعلم النماذج الأصغر من النماذج الأكبر، تحظى أيضًا بزخم بسبب قدرتها على تقديم استنتاج فعال على أجهزة الحافة ذات الموارد المحدودة.
مع تقدم الأمور، ستسرّع تكامل أدوات NAS الأتوماتيكية اكتشاف الهياكل النموذجية المثلى المخصصة للأجهزة على الحافة. تستثمر شركات مثل NVIDIA و Google في أطر NAS التي تعمل على تحسين الأداء في الوقت نفسه بالنسبة للتأخير، والطاقة، والدقة، مما يمكّن من نشر سريع لأحمال العمل من الذكاء الاصطناعي من الجيل التالي على الحافة. علاوة على ذلك، ستكون زيادة التعاون بين تصميم النموذج وتصميم الرقاقة حاسمة لتحقيق مستويات جديدة من الكفاءة، كما أبرزت في دورة Hype Cycle لعام 2024 من Gartner للذكاء الاصطناعي على الحافة.
- استثمر في خطوط أنابيب تحسين النماذج الأوتوماتيكية التي تستفيد من NAS والتدريب المعتمد على الأجهزة لتبسيط النشر عبر منصات الحافة المتنوعة.
- تعاون مع الشركاء في أشباه الموصلات لتنسيق هياكل النماذج مع أحدث المسرعات الذكية منخفضة الطاقة، مثل تلك المقدمة من Intel و Synaptics.
- تابع معايير الناشئة والمبادرات المفتوحة المصدر (مثل LF Edge) لضمان التشغيل البيني وتأمين الحلول التجارية للذكاء الاصطناعي على الحافة ضد ما هو قادم.
باختصار، سيتم تعريف الموجة التالية من تحسين النماذج الخوارزمية من خلال الأتمتة، والتعاون بين الأجهزة، والتركيز المستمر على كفاءة الطاقة. ستتمكن المؤسسات التي تستثمر في هذه الاستراتيجيات بشكل استباقي من الاستفادة بشكل أفضل من الفرص المتزايدة في الذكاء الاصطناعي منخفض الطاقة على الحافة حتى عام 2025 وما بعده.
المصادر والمراجع
- MarketsandMarkets
- Arm
- Qualcomm
- NVIDIA
- TensorFlow Lite
- PyTorch Mobile
- IDC
- ABI Research
- Edge Impulse
- Latent AI
- OctoML
- McKinsey & Company
- STMicroelectronics
- Huawei
- Mordor Intelligence
- الاتحاد الدولي للاتصالات (ITU)
- NXP Semiconductors
- Statista
- Synaptics
- LF Edge