مشية القفز غير المتكافئة دون تقليد: ستقوم سياسة الذكاء الاصطناعي بالغش طالما يتم إنجاز المهام العامة عالية المستوى ، مع نتيجة محتملة لا نتوقعها أو نفضلها. الصورة من حساب : Yang et al.
in

تعليم الروبوتات البشرية سلوكيات الحركة المختلفة باستخدام المظاهرات البشرية

مشية القفز غير المتكافئة دون تقليد: ستقوم سياسة الذكاء الاصطناعي بالغش طالما يتم إنجاز المهام العامة عالية المستوى ، مع نتيجة محتملة لا نتوقعها أو نفضلها. الصورة من حساب : Yang et al.

في السنوات الأخيرة ، قام العديد من فرق البحث حول العالم بتطوير وتقييم التقنيات لتمكين أنماط الحركة المختلفة في الروبوتات ذات الأرجل. تتمثل إحدى طرق تدريب الروبوتات على المشي مثل البشر أو الحيوانات في جعلها تقوم بتحليل ومحاكاة المظاهرات الواقعية. يُعرف هذا النهج باسم تعلم التقليد.

ابتكر باحثون في جامعة أدنبرة في اسكتلندا مؤخرًا إطار عمل لتدريب الروبوتات البشرية على المشي مثل البشر باستخدام المظاهرات البشرية. هذا الإطار الجديد ، الذي تم تقديمه في ورقة تم نشرها مسبقًا على arXiv ، يجمع بين تعلم التقليد وتقنيات التعلم المعزز العميق مع نظريات التحكم الآلي ، من أجل تحقيق الحركة الطبيعية والديناميكية في الروبوتات البشرية.

“كان السؤال الرئيسي الذي طرحناه للتحقيق هو كيفية دمج (1) المعرفة البشرية المفيدة في تحريك الروبوت و (2) بيانات التقاط الحركة البشرية للتقليد في نموذج التعلم المعزز العميق لتعزيز القدرات المستقلة للروبوتات ذات الأرجل بشكل أكثر كفاءة” قال يانغ تشوانيو  ، أحد الباحثين الذين أجروا الدراسة : اقترحنا طريقتين لإدخال المعرفة البشرية المسبقة في إطار DRL “.

يعتمد الإطار الذي ابتكره يانغ وزملاؤه على تصميم فريد للمكافأة يستخدم بيانات تعليق حركة البشر الذين يمشون كمراجع للتدريب. بالإضافة إلى ذلك ، فإنه يستخدم بنيتين عصبيتين هرميتين متخصصتين ، وهما الشبكة العصبية التي تعمل بالطور (PFNN) والشبكة العصبية التكيفية للوضع (MANN).

 

وأوضح يانغ أن “المفتاح لتكرار أنماط الحركة الشبيهة بالإنسان هو تقديم بيانات المشي البشري كعرض توضيحي خبير للعامل التعليمي لتقليد”. “تصميم المكافأة هو جانب مهم من التعلم التعزيزي ، لأنه يتحكم في سلوكه .”

يتكون تصميم المكافأة الذي استخدمه Yang وزملاؤه في مصطلح مهم و إعلان مصطلح تقليد. يوفر المكون الأول من هذه المكونات التوجيه اللازم للروبوت البشري لتحقيق تحرك عالي المستوى ، بينما يتيح الأخر المزيد من أنماط المشي الطبيعية التي تشبه الإنسان. يتماشى هذا التصميم الفريد مع المفاهيم النظرية الرئيسية وراء مناهج التحكم التقليدية الأخرى في البشر.

قام الباحثون بتقييم إطار التعلم المقلد في سلسلة من التجارب التي أجريت في بيئات المحاكاة. ووجدوا أنه كان قادرًا على إنتاج سلوك تحرك قوي في مجموعة متنوعة من السيناريوهات ، حتى في وجود اضطرابات أو عوامل غير مرغوب فيها ، مثل مخالفات التضاريس أو الدفعات الخارجية.

 

قال يانغ: “من خلال الاستفادة من حركات المشي البشرية كعرض توضيحي للخبير الاصطناعي لتقليدها ، يمكننا تسريع التعلم وتحسين الأداء العام للمهمة”. “لقد سمحت لنا المعرفة التوضيحية البشرية بتصميم إطار التعلم لدينا بشكل أكثر جدوى ، والذي يثبت أنه مفيد للمهارات الحركية والتحكم الحركي بشكل عام”.

تشير النتائج التي جمعها هذا الفريق من الباحثين في هذه الحالة من لقطات المشي على البشر ، يمكن أن تعزز بشكل كبير تقنيات التعلم المعزز العميق لتدريب الروبوتات على أنماط الحركة المختلفة. في نهاية المطاف ، يمكن استخدام الإطار الجديد الذي اقترحوه لتدريب الروبوتات البشرية على السير بطريقة مماثلة للبشر بشكل أسرع وأكثر كفاءة ، مع تحقيق المزيد من السلوكيات الطبيعية والشبيهة بالإنسان.

مشية طبيعية متماثلة
مشية تشبه الإنسان مع التقليد: تضمن المظاهرة البشرية سياسة الذكاء الاصطناعي بعدم الانحراف كثيرًا عن الحركات المقترحة. الصورة من حساب : Yang et al

حتى الآن ، قام يانغ وزملاؤه بتقييم إطار عملهم فقط في المحاكاة ، وبالتالي يخططون الآن للتحقق من طرق نقله من بيئات محاكاة إلى إعدادات العالم الحقيقي. يرغبون في النهاية في تنفيذه على روبوت حقيقي للإنسان ، من أجل زيادة تقييم فعاليته وسهولة استخدامه.

وقال يانغ: “في عملنا المستقبلي ، نخطط أيضًا لتوسيع إطار التعلم لتقليد مجموعة أكثر تنوعًا وتعقيدًا من الحركات البشرية ، مثل المهارات الحركية العامة عبر الحركة والتلاعب والاستيعاب”. “نخطط أيضًا للبحث في نقل سياسة المحاكاة إلى الواقع بكفاءة لتمكين النشر السريع للسياسات المكتسبة التي تتكيف مع الروبوتات الحقيقية.”

لمزيد من المعلومات :

  • Learning natural locomotion behaviors for humanoid robots using human knowledge. arXiv:2005.10195 [cs.RO]. من هنا
  • Chuanyu Yang et al. Learning Natural Locomotion Behaviors for Humanoid Robots Using Human Bias, IEEE Robotics and Automation Letters (2020). من هنا
  • Daniel Holden et al. Phase-functioned neural networks for character control, ACM Transactions on Graphics (2017). من هنا
  • He Zhang et al. Mode-adaptive neural networks for quadruped motion control, ACM Transactions on Graphics (2018). من هنا

What do you think?

Comments

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Loading…

0

وليام جيمس سيديس ,,,, قصة أذكى شخص لم تسمع به من قبل

ينتج الذكاء الاصطناعي وجوهًا واقعية من الرسومات الفاشلة