LB's Home

Coding - Thinking


  • 首页

  • 分类

  • 关于

  • 标签

  • 站点地图

【编程语言】Python-NumPy

发表于 2017-11-13 | 分类于 【编程语言】

0 引言

NumPy是Numerical Python的简称,它深深吸引着使用者的原因有下面几点:

  • 底层使用C/C++实现,计算快速且省空间,包含C/C++/Fortran接口;
  • 可以进行矢量运算并具有复杂广播能力
  • 对整组数据进行快速的标准数学运算,而不需要编写循环
  • 具有读写磁盘的数学工具和操作内存映射文件的工具
  • 具有线性代数、随机数生成、傅立叶变换等功能
阅读全文 »

【强化学习】CADRL仿真算法实现

发表于 2017-11-13 | 分类于 【强化学习】
阅读全文 »

【强化学习】利用-探索

发表于 2017-11-11 | 分类于 【强化学习】
阅读全文 »

【强化学习】CADRL仿真环境搭建

发表于 2017-11-08 | 分类于 【强化学习】
阅读全文 »

【强化学习】DPG和DDPG

发表于 2017-11-08 | 分类于 【强化学习】
阅读全文 »

【强化学习】模型估计

发表于 2017-11-06 | 分类于 【强化学习】
阅读全文 »

【强化学习】算法实践-Q-learning

发表于 2017-11-06 | 分类于 【强化学习】
阅读全文 »

【机器学习】梯度下降GD,SGD

发表于 2017-11-06 | 分类于 【机器学习】

0 引言

对于优化问题,经常使用的就是梯度下降算法,但是始终没有搞清楚GD和SGD的差别,翻看了《深度学习》找到了差别,特此记录。

问题描述:对每个样本的损失函数求期望
$$
J(\theta) = \mathbb{E}_{x,y \sim \hat{p}_{data}}L(x,y,\theta)=\frac{1}{m}\sum^{m}_{i=1}L(x^{(i)},y^{(i)},\theta)
$$

阅读全文 »

【强化学习】演员-评论家算法 Actor-Critic

发表于 2017-11-05 | 分类于 【强化学习】
阅读全文 »

【强化学习】算法实践-策略梯度PG

发表于 2017-11-05 | 分类于 【强化学习】
阅读全文 »
123…6
LB

LB

Make Robot Feel The World

54 日志
15 分类
39 标签
GitHub Weibo
Links
  • OverLeaf
  • LeetCode
  • Kaggle
  • Tianchi
© 2017 LB
由 Hexo 强力驱动
主题 - NexT.Pisces
本站总访问量     您是第个来到的小伙伴