الرئيسية » جييك » يساعد الذكاء الاصطناعي في DeepMind على إعادة كتابة قواعد الشطرنج ، والتبييت في خطر

يساعد الذكاء الاصطناعي في DeepMind على إعادة كتابة قواعد الشطرنج ، والتبييت في خطر

يساعد الذكاء الاصطناعي في DeepMind على إعادة كتابة قواعد الشطرنج ، والتبييت في خطر

Shared 0

في المباراة بين الشطرنج والذكاء الاصطناعي ، اتخذ الباحثون في Google DeepMind خطوة أخرى إلى الأمام. هذه المرة من خلال التعاون مع بطل الشطرنج العالمي السابق فلاديمير كرامنيك ، صمم الباحثون واختبروا أشكالًا جديدة من اللعبة المشبعة بالذكاء الاصطناعي.

في محاولة لتحسين التصميم المتوازن للغاية لقواعد هذه اللعبة ، شرع فريق البحث في العثور على أفضل التعديلات التي يمكنهم إجراؤها على هذه اللعبة اللوحية التي تعود إلى قرون. الفكرة؟ قم بتحديث ديناميكيات الشطرنج باستخدام الذكاء الاصطناعي.

استخدم العلماء AlphaZero ، وهو نظام تعليمي تكيفي يمكنه تعلم قواعد جديدة من الصفر والوصول إلى مستويات خارقة من اللعب ، لاختبار نتائج تسعة أشكال مختلفة من الشطرنج تم إعدادها مسبقًا بمساعدة من البطل.

لكل متغير ، لعب AlphaZero عشرات الآلاف من المباريات ضد نفسه

لكل شكل ، لعبت AlphaZero عشرات الآلاف من الألعاب ضد نفسها ، وحللت كل حركة ممكنة لحالة معينة من اللوحة ، ووضعت استراتيجيات وأنماط لعب جديدة. فلاديمير كرامنيك والباحثون ثم قام بتقييم شكل الألعاب بين اللاعبين البشر إذا تم اعتماد هذه الاختلافات لتحديد ما إذا كانت مجموعات مختلفة من القواعد يمكن أن تحسن اللعبة.

لقد تطور الشطرنج كثيرًا على مر القرون. سواء كان ذلك مع ظهور متغيرات جديدة ، لتحسين اللعبة الكلاسيكية ، أو لإدخال تعقيدات جديدة في المسابقات. يمكن أن يكون لتغيير القواعد تأثير كبير على استراتيجية اللعبة وإمكانية اللعب وديناميكياتها ، ولكن تاريخياً لم يكن فهم عواقب تنفيذ نوع معين من الشطرنج ممكنًا إلا بمرور الوقت. ، من خلال مراقبة عدد كافٍ من اللاعبين البشريين.

يقول باحثو DeepMind: "إن تدريب نموذج AlphaZero في ظل هذه التغييرات في القواعد سمح لنا بمحاكاة عقود من اللعب البشري بشكل فعال في غضون ساعات ، والإجابة على سؤال" ماذا لو ": كيف سيبدو؟ يحتمل أن تكون اللعبة وفقًا للنظرية المطورة في كل نوع من أنواع الشطرنج ".

إمكانية للاعب التقاط القطع الخاصة به

من بين التعديلات التي تم اختبارها بواسطة AlphaZero ، هناك إمكانية للاعب لالتقاط قطعه الخاصة ، على سبيل المثال ، أو أن تتحرك البيادق إلى الخلف بمسافة واحدة. "حظر التبييت يحظر التبييت طوال المباراة ، بينما كان هناك شكل آخر هو إعلان الانتصار في حالة بات ، بدلاً من التعادل. "

لعب نظام AI كل متغير ، في 10000 مباراة ، في ثانية واحدة لكل حركة ، وفي 1000 أخرى في دقيقة واحدة لكل حركة. من أجل تحديد تأثير التغييرات على جودة الأجزاء بأكبر قدر ممكن من الموضوعية ، نظر العلماء في عدد من العوامل. أحدها ، الذي أحبط لاعبي الشطرنج منذ زمن سحيق ، هو النسبة العالية من التعادلات.

بشكل عام ، أدت معظم الاختلافات إلى زيادة عدد النتائج الحاسمة المحتملة ، مع بعض القواعد مثل "الجمود (بات) = الفوز" التي أدت إلى التحسين الذي يمكن فهمه. وجد الباحثون أيضًا أن التحكم في التوقيت كان له تأثير على تحديد اللعبة: فألعاب ثانية واحدة لكل حركة كانت أقل احتمالا بكثير أن تنتهي بالتعادل مقارنة بألعاب دقيقة واحدة لكل حركة.

كان من غير المرجح أن تنتهي ألعاب ثانية واحدة لكل حركة بالتعادل مقارنة بألعاب دقيقة واحدة لكل حركة. الصورة: DeepMind.

"بات = النصر"

أظهرت النتائج أيضًا أنه في نسبة كبيرة من الألعاب ، استخدم AlphaZero الحركات الإضافية المتاحة له بموجب القواعد الجديدة ، بدلاً من الالتزام الصارم بالحركات المنتظمة. "يشير هذا إلى أن الخيارات الجديدة مفيدة بالفعل وتساهم في اللعبة ،" لاحظ الباحثون.

بالإضافة إلى التحليل الإحصائي عبر AlphaZero ، طلب الفريق في DeepMind من فلاديمير كرامنيك الإجابة على المزيد من الأسئلة الذاتية حول المواقف والحركات والأنماط التي ظهرت نتيجة للمتغيرات. من حيث المبدأ ، يجب أن تعكس مساهمة اللاعب القواعد التي قد يتبناها مجتمع الشطرنج التقليدي. لطالما كان المعلم الروسي الكبير مؤيدًا لـ Castling Variant ، ويؤكد أن هذه القاعدة قد تكون مثيرة ، حيث إنها تشجع اللعب العدواني من خلال زيادة ضعف ملوك اللاعبين. من ناحية أخرى ، يلاحظ البطل أن متغير "الجمود = النصر" يبدو أنه له تأثير عام طفيف على اللعبة.

كما استعرض الأستاذ الدولي داني رينش ، مدير موقع الشطرنج Chess.com ، نتائج DeepMind في مقطع فيديو. بدلاً من ذلك ، يصف قاعدة "الجمود = النصر" بأنها القاعدة الأكثر احتمالاً لتغيير اللعبة بشكل كبير في مجتمع الشطرنج.

"أعتقد اعتقادا راسخا أن التعادل على نقاط معادلة للنصر لا يمكن أن يساعد فقط في تطوير اللعبة للمبتدئين ، ولكن يمكن أن يكون له أيضًا تأثير من حيث النتائج الحاسمة ،" يدافع.

في النهاية ، بقدر فائدة معرفة AlphaZero ، من المستحيل التنبؤ بقواعد الشطرنج التي ستبقى سارية ، إن وجدت. الطريقة الوحيدة لمعرفة ذلك هي ملاحظة كيف يتبنى اللاعبون الاختلافات المختلفة أو يغيرونها أو يتخلون عنها. قد يكون الوقت مناسبًا لإعادة فتح تطبيق الشطرنج المنسي هذا.

المصدر: ZDNet.com


المقال الأصلي

Shared 0

الوسوم:
لأعلي