Обучение с подкреплением. Заявка на исследование

Игорь Скрягин

«Reinforcement Learning» не только модный тренд (см., например ссылку: https://
www.ias.informatik.tu-darmstadt.de/Main/OpenPositions). Он также главный способ научения в повсевседневной жизни («учиться на собственном опыте», «метод проб и ошибок»). Входные данные при этом сложно организованы – структурированы и состоят из неизвестных и известных компонент – полупараметричны.
Reinforcement Learning как и машинное обучение в целом в неявном виде использует ряд допущений, принимаемых без доказательств – аксиом.
Аксиома 1 (единства): Законы природы едины для всех живых и неживых объектов.
Аксиома 2 (осмысленности): Любая информация семантична – наполнена смыслом.
Аксиома 3 (комбинаторности): Обучение происходит в результате сочетания внутренних догадок (инсайта) с внешними подсказками (подкреплением).
Аксиома 4 (прототипности): Существует общий универсальный язык, лежащий в основе всех типов данных. Единственный реальный претендент на роль такого языка – математика.
Аксиома 5 (эволюционности): Любое обучение происходит эволюционным путем – от простого к сложному.
Формулировка приведенных выше аксиом в явном виде позволяет перейти к постановке следующих проблем:
Проблема А. «Создание последовательной семантической теории информации, удовлетворяющей положениям аксиом 1 и 2 (единство и осмысленность)».
Возможным решением этой проблемы является работа Артемия Колчинского и Дэвида Вольперта «Семантическая информация, автономное агентство и неравновесная статистическая физика», опубликованная в трудах Королевского общества 19 октября 2018 года которая признается рецензентами революционной.
Проблема Б. «Поиск общего алгоритма системного взаимодействия инсайта с подкреплением, удовлетворяющего положениям аксиомы 3 (комбинаторность)».
Проблема В. «Открытие закономерностей обучения, соответствующих естественной последованности этапов в развитии математического мышления (удовлетворяющих положениям аксиом 4 и 5 – прототипность и эволюционность)».
Направления исследований.
К проблеме А: Проверка результатов работы А. Колчинского и Д. Вольперта при помощи методов экспериментальной математики (www.thefullwiki.org/Experimental_mathematics).
К проблеме Б: Математическое моделирование с использованием техник коучинга (https://en.wikipedia.org/wiki/Coaching) и решения изобретательских задач (https://en.wikipedia.org/wiki/TRIZ).
К проблеме В: Формирование эволюционной цепочки приемов обучения в последовательности математического мышления «топологическое – порядковое – метрическое – алгебраическое – проективное».
Выбор конкретного направления исследований в качестве приоритетного будет сделан после обсуждения.

Список читателей / Версия для печати / Разместить анонс / Заявить о нарушении

Другие произведения автора Игорь Скрягин

Рецензии

Написать рецензию

Написать рецензию Написать личное сообщение Другие произведения автора Игорь Скрягин

Мы используем файлы cookie для улучшения работы сайта. Оставаясь на сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с Политикой обработки персональных данных и файлов cookie, нажмите здесь.