Обучение с подкреплением. Заявка на исследование

«Reinforcement Learning» не только модный тренд (см., например ссылку: https://
www.ias.informatik.tu-darmstadt.de/Main/OpenPositions). Он также главный способ научения в повсевседневной жизни («учиться на собственном опыте», «метод проб и ошибок»). Входные данные при этом сложно организованы – структурированы и состоят из неизвестных и известных компонент – полупараметричны.
Reinforcement Learning как и машинное обучение в целом в неявном виде использует ряд допущений, принимаемых без доказательств – аксиом.
Аксиома 1 (единства): Законы природы едины для всех живых и неживых объектов.
Аксиома 2 (осмысленности): Любая информация семантична – наполнена смыслом.
Аксиома 3 (комбинаторности): Обучение происходит в результате сочетания внутренних догадок (инсайта) с внешними подсказками (подкреплением).
Аксиома 4 (прототипности): Существует общий универсальный язык, лежащий в основе всех типов данных. Единственный реальный претендент на роль такого языка – математика.
Аксиома 5 (эволюционности): Любое обучение происходит эволюционным путем – от простого к сложному.
Формулировка приведенных выше аксиом в явном виде позволяет перейти к постановке следующих проблем:
Проблема А. «Создание последовательной семантической теории информации, удовлетворяющей положениям аксиом 1 и 2 (единство и осмысленность)».
Возможным решением этой проблемы является работа  Артемия Колчинского и Дэвида Вольперта «Семантическая информация, автономное агентство и неравновесная статистическая физика», опубликованная в трудах Королевского общества 19 октября 2018 года  которая признается рецензентами революционной.
Проблема Б. «Поиск общего алгоритма системного взаимодействия инсайта с подкреплением, удовлетворяющего положениям аксиомы 3 (комбинаторность)».
Проблема В. «Открытие закономерностей обучения, соответствующих естественной последованности этапов в развитии математического мышления (удовлетворяющих положениям аксиом 4 и 5 – прототипность и эволюционность)».
Направления исследований.
К проблеме А: Проверка результатов работы А. Колчинского и Д. Вольперта при помощи методов экспериментальной математики (www.thefullwiki.org/Experimental_mathematics).
К проблеме Б: Математическое моделирование с использованием техник коучинга (https://en.wikipedia.org/wiki/Coaching) и решения изобретательских задач (https://en.wikipedia.org/wiki/TRIZ).
К проблеме В: Формирование эволюционной цепочки приемов обучения в последовательности математического мышления «топологическое – порядковое – метрическое – алгебраическое – проективное».
Выбор конкретного направления исследований в качестве приоритетного будет сделан после обсуждения.
 


Рецензии