إن الذكاء الاصطناعي على حافة الشبكة نادراً ما يعني استنتاجًا فقط. ينطوي نشر العالم الحقيقي عادةً على إدخال / إخراج عالية السرعة (I / O) ، وتكييف الإشارة ، ودورات التحكم في الوقت الحقيقي ،جميعها يتم تنفيذها بالتزامنتتطلب هذه أحمال العمل متعددة الوظائف تنسيقًا وثيقًا وضمانًا كبيرًا ، وقد وجد المصممون صعوبة في تلبية هذه المتطلبات باستخدام أجهزة الذكاء الاصطناعي السائدة.
هناك عاملان يجعلان هذه المشكلة أكثر تعقيدًا. أولاً، تتطور نماذج الذكاء الاصطناعي بوتيرة مذهلة، مما يدفع المصممين إلى اعتماد منصات تدعم تحديثات خوارزمية سريعة.العديد من أنظمة الحافة كانت تستخدم في الموقع لمدة تصل إلى عشر سنوات أو أكثر، مما يجعل من الصعب ضمان القدرة على التكيف على المدى الطويل.علماء البيانات يستخدمون PyTorch و TensorFlow، في حين أن الفرق المدمجة تستخدم سلاسل أدوات مختلفة تمامًا ، مما يخلق الاحتكاك أثناء عملية التسليم و يبطئ سرعة الإنتاج.
لمواجهة هذه التحديات، تحتاج المنصات إلى أن تكون قادرة على الجمع بين معالجة الذكاء الاصطناعي عالية الإنتاجية مع السلوك الحتمي، وإدخال/إخراج مرن، والقدرة على التكيف على المدى الطويل،كل ذلك يجب أن يتحقق ضمن نطاق استهلاك الطاقة النموذجي لتنفيذ الحافة المحدودة.
تركز هذه المقالة على سيناريوهات التطبيقات والمتطلبات ذات الصلة التي تتحدى المصممين لاستكشاف بنيات جديدة للذكاء الاصطناعي.قدمت أجهزة Altera's Field Programmable Gate Array (FPGA) وأدوات البرمجيات التي تدعم AI الحافة، وأظهرت كيفية استخدامها لتلبية متطلبات الأداء والطاقة المتنوعة لهذه التطبيقات.
يتطلب تطور الذكاء الاصطناعي المتطور الابتكار المعماري
تتبنى أنظمة الحافة بشكل متزايد تقنيات الذكاء الاصطناعي المتنوعة ، بما في ذلك التعلم الآلي الكلاسيكي للكشف عن الشذوذ ، الشبكات العصبية التشنجية (CNN) للتصور ،ومحولات لنماذج اللغة الكبيرة (LLM)غالبًا ما تتعايش هذه الخوارزميات المكثفة الحسابية مع وظائف غير ذكية تطلب مثل معالجة الإشارات والاتصالات الشبكة والتحكم في الوقت الحقيقي.
النظم المستقلة هي مثال جيد. تحتاج عادة إلى التقاط البيانات من طرق مستشعرات متعددة مثل الفيديو والصوت والرادار وLiDAR وتغذية التغذية على الحركة / الموقف ،معالجة هذه التدفقات البيانات مع سعة عالية، تحليل النتائج باستخدام الذكاء الاصطناعي المعقد، ومن ثم إدارة حلقات التحكم عالية الدقة، والتي تتطلب جميعها تحديد موثوق به.
هناك العديد من الأمثلة المماثلة في الأتمتة الصناعية، التصوير الطبي، الدفاع، وتطبيقات الاتصالات.التحدي المشترك الذي يواجههم هو أن البنايات التقليدية يصعب تكييفها مع أحمال العمل المتقاربة باستمرار.
لماذا FPGA مناسبة بشكل خاص ل AI الحافة
على النقيض من ذلك ، هذه المتطلبات متوافقة تمامًا مع وظائف FPGA. جوهر FPGA هو توفير منطق قابلة للتكوين لإجراء العمليات بطريقة متوازية حقًا ،مع سلوك التوقيت المدمج في وقت التصميم بدلا من التقلبات في وقت التشغيل. يمكن لهذه الهندسة المعمارية تحقيق تحديد تأخير منخفض ، وهو أمر حاسم للذكاء الاصطناعي الحد. يمكن أن يستفيد المنطق المرن أيضًا من إدخالات / إخراج قوية: عادة ما توفر FPGAs إدخالات / إخراج عالية السرعة وفيرة ،والتي يمكن توصيلها بأجهزة استشعار ومحركات مختلفة لتحقيق ارتباط وثيق مع معالجة الذكاء الاصطناعي.
تتضمن FPGA أيضًا ذاكرة داخلية موزعة ، والتي تمكن البيانات من الوصول إليها من خلال المنطق الذي يعمل عليها.هذا يقلل من اختناق الزجاجة التي تنشأ عندما يتعين على مراحل معالجة متعددة التنافس للوصول إلى حافلة الذاكرة المشتركة، وهو قيود شائعة في المعالجات المعتمدة على المعالجات.
تتضمن العديد من FPGAs أيضًا أجهزة معالجة إشارات رقمية متخصصة (DSP). بالمقارنة مع الهياكل التقليدية ،هذه الدوائر المحسنة توفر أداء أعلى وكفاءة طاقة أفضل لحملات عمل معالجة الإشارةبعض أجهزة FPGA تدمج أيضًا أنظمة معالجات سلكية صلبة يمكنها تشغيل كومة برمجيات قياسية (بما في ذلك لينكس) ، مما يتيح تطوير البرمجيات التقليدية لمهام مثل الشبكات ،إدارة الأجهزةوواجهة المستخدم
باختصار ، يمكن لجهاز FPGA واحد دمج الوظائف التي قد تتطلب عادة رقائق إدخال / إخراج منفصلة ، ومسرعات الذكاء الاصطناعي ، و DSPs ، ومعالجات الطائرة التحكمية. وهذا يمكن أن يقلل من فاتورة المواد (BOM) ،تقليص مساحة لوحة الدوائر، انخفاض استهلاك الطاقة، مع الحفاظ على انخفاض فترة الكمون واليقين المطلوبين لتطبيقات الذكاء الاصطناعي الحافة.
كيفية فتح إمكانيات جديدة مع إضافة كتل التنسورات الذكية
أجهزة FPGA DSP التقليدية مناسبة بالفعل للعديد من أحمال العمل الحافة ، ولكن استنتاج الذكاء الاصطناعي يعتمد غالبًا على عمليات ضرب كثيفة ولكن منخفضة الدقة. لمعالجة هذه المشكلة ،أجهزة Agilex 3 و Agilex 5 من Altera تستخدم DSPs محسنة مع كتل tensor AIهذا هو الأجهزة المتخصصة لمصفوفة مصفوفة ومضاعفة مصفوفة متجه، والتي تظهر مرارا وتكرارا في الرسوم البيانية الحسابية الذكية.
جوهر هذه الطريقة هو المنتج المقياسي ومحرك الجمع / المتراكم (الشكل 1). في وضع التنسور،محرك النقطة المتصل بالأسلاك الصلبة يستخدم مدخلات 8-بيت ووزن 8-بيت مسبق تحميله لتنفيذ منتج نقطة 10 عنصرمن أجل توسيع النطاق الديناميكيمسار البيانات يمكن أن يستخدم أيضا "مؤشر مشترك" لتوسيع النقطة العائمة الكتلة للتعامل مع السيناريوهات النموذجية حيث استنتاج الذكاء الاصطناعي يتطلب عادة نطاق ديناميكي عالية ولكن دقة منخفضة.

