Нейросетевое моделирование игры в крестики-нолики

Заказать уникальную курсовую работу
Тип работы: Курсовая работа
Предмет: Python
  • 29 29 страниц
  • 3 + 3 источника
  • Добавлена 10.07.2022
1 496 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы
Введение 2
Глава 1. Применение искусственного интеллекта в играх 3
1.1. Характеристика проблемной ситуации 3
1.2. Обзор архитектуры сети и процессов обучения 5
1.4. Описание выходной информации и исходных данных 13
Глава 2. Создание самообучающейся модели для игры в крестики нолики 14
2.1. Особенности нейросетевых решений 14
2.2. Особенности применения выбранного подхода к решению проблемной ситуации 22
Глава 3. Анализ полученных результатов и выводы 27
Заключение 28
Литература 29
Приложения 30

Фрагмент для ознакомления

Область применения нейронных сетей в настоящее время постоянно расширяется,существует множество успешных решений, использующих этот подход.Такая успешная реализация нейросетевых решений в первую очередь обусловленаих преимуществами перед традиционными методами [4,5]:сотни входных сигналов и от десятков до сотен тысяч эталонных ситуаций могутбыть быстро обучены на обычном компьютере;- возможность работы при наличии большого количества неинформативных, зашумленных входных сигналов − нет необходимости делать их предварительный скрининг, нейронная сеть сама определит их непригодность для решения задачи и может явноотбросить их;- возможность работы с коррелированными независимыми переменными,с различными типами информации − непрерывной и дискретной, количественной и качественной, что часто затрудняет применение статистических методов;- нейронная сеть может одновременно решать несколько задач на одномнаборе входных сигналов − имея несколько выходов, прогнозировать значениянескольких показателей;- алгоритмы обучения предъявляют довольно мало требований к структуре нейронной сети и свойствам ее нейронов. Поэтому, если у вас есть экспертныезнания или в случае особых требований, вы можете целенаправленно выбратьтип и свойства нейронов и нейронных сетей, соберите структуру нейронной сети вручную, из отдельных элементов, и установите желаемые свойства для каждого из них.Несмотря на большие возможности, существует ряд недостатков, которыевсе еще ограничивают использование нейросетевых технологий. Нейронные сетипозволяют нам находить только неоптимальное решение, а потому неприменимы для задач, в которых требуется высокая точность.Функционируя по принципу черного ящика, они также неприменимы в том случае, когда необходимо объяснить причину принятия решения.Обученная нейронная сеть дает ответ за доли секунд, но относительно высокие вычислительные затраты на процесс обучения как по времени, так и пообъему занимаемой памяти также существенно ограничивают возможности ихиспользования. И все же класс задач, для которых эти ограничения неявляются критичными, довольно широк.Возможности, предлагаемые нейронными сетями на данный момент времени, позволят создать новое поколение систем управления, то есть тех, которые обладают определенной степенью интеллекта. Определенная интеллектуализациясистем управления даст несомненные преимущества.Благодаря одному из своих удивительных свойств, способности к обучениюнейронных сетей, вы сможете создавать системы управления, которые будут способны адаптироваться к изменяющимся со временем свойствам объекта, что, несомненно, повлияет на качество управления.2.2. Особенности применения выбранного подхода к решению проблемной ситуацииОсновной задачей является разработка программы, которая самостоятельно учится играть в крестики-нолики. Ожидается, что программа будет обучаться, играя в большое количество итераций игры. Программе не предоставляется предварительная информация об игре, единственная информация, предоставляемая ей, заключается в том, была ли игра выиграна /проиграна /сыграна вничьюЧтобы разбить проблему на более простые части, давайте определим некоторые термины.Программа самообучения - это система, которая, как ожидается, научит пользователя играть в крестики-нолики. Он состоит из следующих компонентов:Генератор Ходов: для заданного состояния доски генератор допустимых ходов выводит набор всех возможных допустимых следующих состояний доски для игрокаОценщик (Модель Нейронной сети): для данного состояния доски оценщик прогнозирует оценкуПереключатель перемещения программы: для заданного состояния доски селектор хода программы выбирает следующий ход для Программы, используя следующий подход:Используйте Генератор ходов, чтобы получить набор всех возможных законных состояний следующей доски.Для каждого из возможных законных следующих состояний правления, указанных выше, используйте Оценщик и прогнозируйте оценку.Для следующего хода выбирается возможное следующее состояние доски с наибольшим прогнозируемым счетом. ​Программа обучается, играя несколько итераций игр против закодированного противника. Упомянутый выше "Оценщик" представляет собой модель нейронной сети. Во время первой игры нейронная сеть (оценщик) инициализируется со случайными весами.После того, как программа сыграет первую игру, результаты, полученные нейронной сетью, корректируются следующим образом:Если игра была выиграна программой, присвоите последнему состоянию доски оценку 1. Аналогично, присвоите оценку -1, если игра была проиграна, и 0, если игра была сыграна вничью.Для каждого из предыдущих состояний доски назначьте оценку, которая была предсказана для следующего состояния доски. Например, предпоследнему состоянию доски присваивается оценка, которая была предсказана для последнего состояния доски, и так далее*Обновите веса нейронной сети (используя SGD), подгоняя ее к состояниям платы и скорректированным баллам.Повторяйте описанный выше процесс снова и снова, в течение большого количества игр, обновляя нейронную сеть после каждой игры.Логика подхода заключается в том, что для игрока, если конечное состояние доски было выигрышным состоянием, то состояния доски, ведущие к конечному состоянию, также были бы благоприятнымиПоскольку процесс обновления веса повторяется в течение игр, нейронная сеть учится присваивать более высокий балл благоприятным состояниям доски и более низкие баллы неблагоприятным состояниям доски.Ниже приведена диаграмма того, как веса модели будут обновляться после каждой игры:​​Генератор ходов возвращает словарь со всеми возможными юридическими координатами и их результирующими сглаженными состояниями numpyboard.Ожидается, что после обучения Оценщик научится присваивать более высокие баллы состояниям правления, которые благоприятны для программы.В нашем ядре мы используем нейронную сеть в качестве функции оценки. Веса нейронной сети вводятся случайным образом. Архитектура / гиперпараметры нейронной сети были выбраны методом проб и ошибок и могут быть оптимизированы в дальнейшем.Нейронная сеть принимает в качестве входных данных сплющенный массив numpy для игры в крестики-нолики и выдает результат.Программный селектор ходов выбирает следующий ход для игрока с учетом текущего состояния доски, используя следующий подход:Используйте генераторходов, чтобы получить все возможные следующие состояния доски.Используйте оценщик (модель) для оценки каждого возможного следующего состояния доски.Следующее состояние доски, которому присвоен наивысший балл, выбирается в качестве следующего состояния доски.Глава 3. Анализ полученных результатов и выводыСозданная модель позволяет предсказывать оптимальный следующий ход в игре Крестики нолики. Проиграв большое число партий нейронная сеть вычислила закономерности и определила возможные выигрышные стратегии для разных вариантов.Игра Крестики нолики не отличается сложностью продумывания ходов на много итераций вперед. В отличие, например, от шахмат, где важно определить возможные действия на несколько ходов вперед. Тем не менее, заложенную базу можно использовать для работы с более сложными играми или системами принятия решения в целом.Системы принятия решений необходимы, когда дело касается автоматизации обычных процессов – на предприятии, в благоустройстве города, административном секторе.ЗаключениеВ рамках данной работы была поставлена цель создания модели, играющей в крестики нолики. Игра в крестики нолики не считается сложной, однако хорошо иллюстрирует работу самообучающихся систем, которые путем многочисленных повторений выявляют закономерности, необходимые для определения выигрышной стратегии.Созданную модель можно использовать для обучения игре или основе для дальнейших разработок. Работа состоит из 2 глав, включая в себя общий обзор рассматриваемой проблемы, описание существующих подходов к обучению, описание процесса создания модели и выводы.Дальнейшая работа может быть связана с применением описанного подхода для создания моделей для более сложных игр или систем принятия решений. ЛитератураАлифиров А.И. // Проблемы развития науки и образования: теория и практика. Сборник научных трудов поматериалам Международной научно-практической конференции 31 августа 2015 г.: в 3 частях. Часть II. М.:"АР-Консалт", 2015 г. – С. 13-14.2. Михайлова И.В., Алифиров А.И. Тактические действия шахматистов / Михайлова И.В., Алифиров А.И. //Результаты научных исследований Сборник статей Международной научно-практической конференции.Ответственный редактор: СукиасянАсатур Альбертович (15 февраля 2016 г.) в 4 ч. Ч/3 – Уфа: АЭТЕРНА. –2016. С. 119-121.3. Михайлова И.В., Алифиров А.И. Теоретико-методологические основы метода мышления схемамишахматистов / Михайлова И.В., Алифиров А.И. // Результаты научных исследований Сборник статейМеждународной научно-практической конференции. Ответственный редактор: СукиасянАсатурАльбертович (15 февраля 2016 г.) в 4 ч. Ч/3 – Уфа: АЭТЕРНА. – 2016. С. 123-125.4. Михайлова И.В. Подготовка юных высококвалифицированных шахматистов с помощью компьютерныхшахматных программ и "интернет" :автореф. дис. ... канд. пед. наук : 13.00.04 / Михайлова ИринаВитальевна; РГУФК. – М., 2005. – 24 с.Приложения

1. Алифиров А.И. // Проблемы развития науки и образования: теория и практика. Сборник научных трудов поматериалам Международной научно-практической конференции 31 августа 2015 г.: в 3 частях. Часть II. М.:"АР-Консалт", 2015 г. – С. 13-14.
2. Михайлова И.В., Алифиров А.И. Тактические действия шахматистов / Михайлова И.В., Алифиров А.И. //Результаты научных исследований Сборник статей Международной научно-практической конференции.Ответственный редактор: СукиасянАсатур Альбертович (15 февраля 2016 г.) в 4 ч. Ч/3 – Уфа: АЭТЕРНА. –2016. С. 119-121.
3. Михайлова И.В., Алифиров А.И. Теоретико-методологические основы метода мышления схемамишахматистов / Михайлова И.В., Алифиров А.И. // Результаты научных исследований Сборник статейМеждународной научно-практической конференции. Ответственный редактор: СукиасянАсатурАльбертович (15 февраля 2016 г.) в 4 ч. Ч/3 – Уфа: АЭТЕРНА. – 2016. С. 123-125.
4. Михайлова И.В. Подготовка юных высококвалифицированных шахматистов с помощью компьютерныхшахматных программ и "интернет" :автореф. дис. ... канд. пед. наук : 13.00.04 / Михайлова ИринаВитальевна; РГУФК. – М., 2005. – 24 с.

Вопрос-ответ:

Зачем искусственный интеллект применяется в играх?

Искусственный интеллект применяется в играх для создания более умных и реалистичных противников, а также для разработки систем автоматического обучения, которые могут самостоятельно улучшать свои навыки.

Какая архитектура сети используется в данной работе?

В данной работе используется нейронная сеть с применением сверточных слоев.

Какие данные используются для обучения модели?

Для обучения модели используются данные, представляющие игровое поле крестиков-ноликов и ходы игроков.

Какое преимущество дает использование нейросетевых решений в игре в крестики-нолики?

Использование нейросетевых решений позволяет создать более интеллектуального соперника, который может научиться играть на опыте и постепенно улучшать свои стратегии и тактику.

Какие результаты и выводы были получены после анализа работы модели?

После анализа работы модели были получены результаты, свидетельствующие о высокой эффективности и точности прогнозирования ходов игры. Выводы показали, что нейросетевое моделирование является эффективным подходом к решению проблемы игры в крестики-нолики.

Какие проблемы может решать искусственный интеллект в играх?

Искусственный интеллект в играх может решать различные проблемы, например, создание умных игровых персонажей, разработка алгоритмов поведения, оценка и прогнозирование стратегий игры, управление процессом игры и т.д.

Какая архитектура сети используется в моделировании игры в крестики-нолики?

В моделировании игры в крестики-нолики используется нейронная сеть с заданной архитектурой. Подробнее об архитектуре сети и процессе ее обучения можно прочитать в главе 1 статьи.

Какие особенности имеют нейросетевые решения при создании самообучающейся модели для игры в крестики-нолики?

Нейросетевые решения при создании самообучающейся модели для игры в крестики-нолики имеют свои особенности. Например, важно выбрать подходящую архитектуру сети, определить тип обучения, правильно настроить параметры обучения и т.д. Более подробно об этом можно узнать из главы 2 статьи.

Какую информацию можно получить на выходе при использовании разработанной модели для игры в крестики-нолики?

При использовании разработанной модели для игры в крестики-нолики можно получить различную выходную информацию. Например, модель может предоставить предсказания о следующем действии игры, оценку текущего состояния игры, вероятность выигрыша и т.д. Подробнее об этом описывается в главе 1 статьи.

Какие результаты были получены при анализе созданной модели для игры в крестики-нолики?

Результаты анализа созданной модели для игры в крестики-нолики позволяют сделать определенные выводы. Подробности об анализе и полученных результатах можно найти в главе 3 статьи.

Какой подход был использован для моделирования игры в крестики-нолики?

Для моделирования игры в крестики-нолики был использован подход на основе нейронных сетей.