博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
强化学习1
阅读量:7013 次
发布时间:2019-06-28

本文共 220 字,大约阅读时间需要 1 分钟。

只是初步涉猎,因为读的论文涉及到了。

学习资料来自于网络,主要是udacity的cs600,佐治亚理工的老师

本来以为第一遍看视频就能完全搞懂了,并没有

还是写随笔好好整理一下

三种学习的类型:有监督,无监督,强化

实际的世界,系统,状态之间的转移由马尔可夫的状态转移概率确定。

States:$ s\ belones\ to\ S$

转载于:https://www.cnblogs.com/zherlock/p/10530994.html

你可能感兴趣的文章
关于三元运算符的一个问题
查看>>
11.04T1 枚举
查看>>
滑雪 记忆化搜索简单模型
查看>>
生成随机字符串 可以用在项目上作为 单号之类的
查看>>
简单的 canvas 翻角效果
查看>>
window 7 下面解决修改hosts文件
查看>>
android笔试题二
查看>>
TP5数据库操作方法
查看>>
qu(判定操作序列)NOIP模拟 数据结构判断 模拟
查看>>
Linux杂学
查看>>
更新SVN时提示要清理,但清理失败,乱码得解决方案
查看>>
连接mysql数据库,创建用户模型
查看>>
Nhibernate总结(一)查询返回指定字段
查看>>
Uva 10106 - Product
查看>>
Uva 101 - The Blocks Problem
查看>>
Eclipse 调试Bug之使用断点的七大技巧
查看>>
APP在用户设备发生crash,应该怎么修复
查看>>
Nodejs项目重复文件扫描
查看>>
RabbitMQ路由类型
查看>>
URL参数解析为一个对象
查看>>