强化学习1-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

强化学习1

阅读量：7013 次

发布时间：2019-06-28

本文共 220 字，大约阅读时间需要 1 分钟。

只是初步涉猎，因为读的论文涉及到了。

学习资料来自于网络，主要是udacity的cs600，佐治亚理工的老师

本来以为第一遍看视频就能完全搞懂了，并没有

还是写随笔好好整理一下

三种学习的类型：有监督，无监督，强化

实际的世界，系统，状态之间的转移由马尔可夫的状态转移概率确定。

States:$ s\ belones\ to\ S$

转载于:https://www.cnblogs.com/zherlock/p/10530994.html

你可能感兴趣的文章

关于三元运算符的一个问题

滑雪记忆化搜索简单模型

生成随机字符串可以用在项目上作为单号之类的

简单的 canvas 翻角效果

window 7 下面解决修改hosts文件

android笔试题二

TP5数据库操作方法

qu（判定操作序列）NOIP模拟数据结构判断模拟

更新SVN时提示要清理，但清理失败，乱码得解决方案

连接mysql数据库，创建用户模型

Nhibernate总结（一）查询返回指定字段

Uva 10106 - Product

Uva 101 - The Blocks Problem

Eclipse 调试Bug之使用断点的七大技巧

APP在用户设备发生crash，应该怎么修复

Nodejs项目重复文件扫描

RabbitMQ路由类型

URL参数解析为一个对象

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-06 04:40:57 当前IP: 18.191.93.201 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我