【强化学习】利用-探索 发表于 2017-11-11 | 分类于 【强化学习】 | 字数统计: 30(字) | 热度 °C 0 引言1 k摇臂赌博机问题2 广告推送任务参考文献[1] David Silver, reinforcement learning lecture 9