رئيسي ابتكر ضغطت للتو على إعادة تعيين الذكاء الاصطناعي من Google 'Alpha Go Zero' حول كيفية التعلم

ضغطت للتو على إعادة تعيين الذكاء الاصطناعي من Google 'Alpha Go Zero' حول كيفية التعلم

برجك ليوم غد

تذكر (بشكل غامض) كيف تعلمت المشي أو التحدث أو ركوب الدراجة أو القيادة؟ كانت فوضوية ومليئة بالأخطاء ، لكن المهارات التي تعلمتها بهذه الطريقة بقيت. خارج الأنظمة الحية ، كان من الصعب بناء خوارزميات قوية بما يكفي للاستفادة من 'تجربة الحياة الواقعية' وتطوير سلوكيات ثابتة وقابلة للتكيف للذكاء الاصطناعي.

حسنًا ، لقد فعلها برنامج Alpha Go Zero للتو.

يبدأ من لوحة فارغة ويكتشف فقط لنفسه ، فقط من اللعب الذاتي ، وبدون أي معرفة بشرية ، أو أي بيانات بشرية ، أو ميزات ، أو أمثلة ، أو تدخل من البشر. يكتشف كيف تلعب لعبة Go from First Principles ، كما يقول أستاذ DeepMind David Silver.

لقد كان للذكاء الاصطناعي العديد من التكرارات ، كل منها أكثر ذكاءً وقدرة من السابق. استخدم الإصدار السابق قاعدة بيانات ضخمة للألعاب السابقة إلى جانب مجموعة من الخوارزميات التي وجهتها نحو الفوز. أدى هذا النهج إلى هزيمة بطل العالم المحترف Go لاعب. في لعبة البوكر ، نجح AI Libratus في اختراق أفضل لاعبي البوكر في العالم بحوالي 2 مليون دولار ، وأيضًا من خلال التعلم من خلال اللعب الذاتي بدلاً من بيانات اللعبة البشرية.

كم يبلغ طول أسبوع دالون

الآن ، في هذا الإصدار الأخير من Alpha Go ، تم تدريس برنامج الذكاء الاصطناعي بحد ذاتها كيف ألعب Go - بدون خلفية بشرية.

بعد إجراء الملايين من محاكاة الألعاب ضد نفسها ، استغرق الأمر 40 يومًا حتى تتعلم - من الصفر - كيفية التغلب على نسخة بطل العالم من نفسها. هذا حقًا يغير قواعد اللعبة ، ليس فقط بالنسبة لـ Go ، ولكن أيضًا لكيفية اكتشاف المعرفة الجديدة. ما مدى دقة أو اكتمال خبرتك في المجال؟ هناك كثيرا المزيد لاكتشافه ، هو ما تخبرنا به هذه التجربة الرائعة في التعلم باستخدام Alpha Go Zero.

وفقًا لما ذكره سيلفر في منشور على موقع YouTube حول الانجاز.

يسميها فريق Alpha Go Zero Deep Mind هذا المبدأ الأول ، تعلم 'tabula rasa' (لوحة بيضاء).

'إذا كنت تستطيع تحقيق طبلة راسا التعلم ، لديك وكيل يمكن نقله من لعبة Go إلى أي مجال آخر ، وتفاصيل اللعبة التي تشارك فيها ، توصلت إلى خوارزمية عامة بحيث يمكن تطبيقها في أي مكان. . هذه فكرة استفزازية عندما تقوم بتوسيع المفهوم. فكر فقط فيما يمكننا فعله بمجموعة من خوارزميات التعلم القوية التي يمكنها معالجة المشكلات الصعبة بشكل منهجي والتعلم بشكل أسرع من المعرفة الجماعية لحضارتنا. . . في أيام وليس عقود.

جينا مونتانر السابق لخورخي راموس

قال سيلفر في الوقت الحالي ، المهم هو أن 'الخوارزميات مهمة أكثر بكثير من الحوسبة أو البيانات المتاحة'. هذا وحده يغير قواعد اللعبة في الطريقة التي نتعامل بها مع توسيع العالم المعروف. بينما يعمل Alpha Go على حوالي 25 مليون دولار من الأجهزة - إنه ليس نظامًا خفيف الوزن تمامًا - أنت تعلم أن خبراء الذكاء الاصطناعي يعملون منذ فترة طويلة على إنشاء مجموعات بيانات أنظف وأفضل. اليوم ، تعتبر العديد من مجموعات البيانات الضخمة صاخبة للغاية - مليئة بالبيانات السيئة - لتدريب الذكاء الاصطناعي بدقة. إذا كان الذكاء الاصطناعي يتعلم من البيانات ، وكانت البيانات سيئة ، فإنه لا يتعلم. مشكلة كبيرة.

ماذا لو لم تكن بحاجة إلى بيانات نظيفة ، بل مجرد خبرة ، ويمكن للذكاء الاصطناعي تدريب نفسه؟

هذا هو الإنجاز المثير في Alpha Go Zero. على الرغم من أنها في عالم الألعاب المتخصصة والقائمة على القواعد ، إلا أن لها آثارًا كبيرة في كل صناعة تعمل من القواعد المادية - فكر في الكيمياء وحركة المرور وعلم الأحياء وعلم العقاقير والسفر والخدمات اللوجستية والتصنيع. إذا تمكنا من تصميم قواعد مرنة للغاية ، فيمكنها العمل من خلال خبرة أوسع ، واتجاهية بحيث تخلق دائمًا مهارة أقوى - مثل Alpha Go Zero - عندها من الممكن تحقيق الذكاء الاصطناعي الذي يدير الأنظمة. لن تحتاج هذه الأنظمة إلى بيانات خارجية ، ولن تواجه مشاكل في تنظيف البيانات ، ولا تحتاج إلى تباطؤ بشري في الحلقة. وهذا جزئيًا هو السبب الذي يجعل شركة Alphabet ، الشركة الأم لشركة Google ، تراهن الشركة على الذكاء الاصطناعي وتستثمر في الذكاء الاصطناعي بمعدل سريع. (تستثمر أمازون أيضًا في الذكاء الاصطناعي ، مثل استحواذها الأخير على BodyLabs للذكاء الاصطناعي.)

تري بروكس وإخوته

يقول ديفيد سيلفر ، الأستاذ في برنامج Deep Mind ، 'إن حقيقة أننا رأينا برنامجًا يحقق أداءً عالي المستوى ... يجب أن تعني أنه يمكننا الآن البدء في معالجة بعض أكثر المشكلات تحديًا وتأثيرًا للإنسانية.'

تم تحديث هذا المنشور لتوضيح أن AI Libratus تغلب مؤخرًا على أفضل لاعبي البوكر باستخدام إستراتيجية تتضمن اللعب الذاتي بدلاً من البيانات التي يدخلها الإنسان.