אני מניח שזה לא קשה לך לקבל, ולמעשה בעיות למידה הופכים לבעיה
של למצוא מינימום לפונקציה, כאשר הפונקציה מוגדרת ע"י אפשרות
לדגום אותה במקומות כרצוני. (פונקציה מסובכת במספר גדול מאוד
של משתנים)אני לא אומר שזה פשוט, וכן פתרון טוב לבעיית למידה באופן כללי
אין ממש, אבל יש הרבה שיטות כלליות שטובות להרבה מקרים בהתאמות
קטנות, ביניהן רשתות עצביות ואלגוריתמים גנטיים.
נסביר להלן אלגוריתם פשוט מאוד בשביל ללמד מחשב לשחק איקס-עיגול:
אם אנו מתעלמים ממצבים שקולים מטעמי סימטריה(סיבוב ושיקוף) אז
במשחק איקס עיגול יש מספר דיי מוגבל של מצבים אפשריים.
ננסה ללמוד מה הוא המהלך הנכון בכל אחד מהמצבים. בכל מצב יש לנו
מספר מהלכים אפשריים. בתחילה ניתן לכל מהלך ציון זהה אפס.
נתחיל לשחק, בכל צעד אנו נסתכל על הציון שנתנו למהלכים השונים
ונבחר באקראי מבין המהלכים עם הציון הגבוהה ביותר.
בסוף המשחק עם נצחנו, נוסיף 1 לציון של כל המהלכים אותם ביצענו,
עם בסוף המשחק הפסדנו נחסיר אחד מכל המהלכים שבצענו.
לאחר שנשחק מספר רב של משחקים המחשב נגד עצמו או לחילופין המחשב
נגד שחקן אנושי, המחשב ילמד מה הוא המהלך הטוב ביותר בכל מצב.
זה אלגוריתם מאוד מאוד פשוט, וכמובן יש עמו כמה בעיות,
אבל אני מקווה שזה מבהיר לך שאפשר לכתוב תוכנית שלומדת מטעויות.
DRYICE