DeepHack.Turing: Maksim Kretov - Applications of RL techniques in NLP: An overview
DeepHack.RL: Gabriel Synnaeve - E2D2: Episodic exploration for deep deterministic policies
hacker deep hack named Nekaai
FastLearning space invaders
Few research ideas — Максим Кретов
001. Методы анализа формы входных данных и следствия для структуры нейронной сети - Максим Кретов
Обучение с подкреплением в реальных задачах — Максим Кретов
The Deephack and dotChuckles Podcast 1
003. Обучение с подкреплением и виды внутренней мотивации агента - Максим Кретов
Boosting NLP with reinforcement learning -- Andy Mullenix -- Bay Area Research in NLP and ML
THE BRIL / REDONE TECHNOLOGIES ( NLP for RL, Karthik, Princeton University) Part 1
Reinforcement Learning for NLP framework, by Sreeramana Mavilla Software Engineer at Intel
Стохастические вычислительные графы в NLP | Технострим