斯坦福大学CS234强化学习课程2019年冬季中文翻译讲义项目_包含马尔可夫决策过程值函数策略梯度深度Q网络蒙特卡洛方法时序差分学习模型预测控制多臂赌博机部分可观测.zip
资源类型:本地上传资源
大小:4.79MB
评分:
5.0
上传者:A121414142342
更新日期:2025-10-12
斯坦福大学CS234强化学习课程2019年冬季中文翻译讲义项目-包含马尔可夫决策过程值函数策略梯度深度Q网络蒙特卡洛方法时序差分学习模型预测控制多臂赌博机部分可观测.zip
资源文件列表(大概)
文件名
大小
说明文件.txt
663B
附赠资源.docx
42.14KB
stanford-cs234-notes-zh-master/.gitignore
1.22KB
stanford-cs234-notes-zh-master/CONTRIBUTING.md
2.14KB
stanford-cs234-notes-zh-master/LICENSE
14.77KB
stanford-cs234-notes-zh-master/README.md
2.03KB
stanford-cs234-notes-zh-master/update.sh
65B
stanford-cs234-notes-zh-master/docs/1.md
8.79KB
stanford-cs234-notes-zh-master/docs/10.md
35.13KB
stanford-cs234-notes-zh-master/docs/11&12.md
16.33KB
stanford-cs234-notes-zh-master/docs/14.md
12.01KB
stanford-cs234-notes-zh-master/docs/3.md
23.05KB
stanford-cs234-notes-zh-master/docs/4.md
15.32KB
stanford-cs234-notes-zh-master/docs/5.md
9.87KB
stanford-cs234-notes-zh-master/docs/6.md
20KB
stanford-cs234-notes-zh-master/docs/7.md
10.05KB
stanford-cs234-notes-zh-master/docs/8&9.md
21.27KB
stanford-cs234-notes-zh-master/docs/img/fig11&12_1.png
84.5KB
stanford-cs234-notes-zh-master/docs/img/fig11&12_alg_1.png
68.12KB
stanford-cs234-notes-zh-master/docs/img/fig14_1.png
72.49KB
stanford-cs234-notes-zh-master/docs/img/fig14_2.png
214.38KB
stanford-cs234-notes-zh-master/docs/img/fig14_3.png
253.74KB
stanford-cs234-notes-zh-master/docs/img/fig14_4.png
136.53KB
stanford-cs234-notes-zh-master/docs/img/fig14_alg_1.png
79.53KB
stanford-cs234-notes-zh-master/docs/img/fig14_alg_2.png
64.62KB
stanford-cs234-notes-zh-master/docs/img/fig14_alg_3.png
64.37KB
stanford-cs234-notes-zh-master/docs/img/fig1_1.png
53.42KB
stanford-cs234-notes-zh-master/docs/img/fig1_2.png
132.37KB
stanford-cs234-notes-zh-master/docs/img/fig1_tab_1.png
44.25KB
stanford-cs234-notes-zh-master/docs/img/fig3_1.png
179.88KB
stanford-cs234-notes-zh-master/docs/img/fig3_2.png
142.93KB
stanford-cs234-notes-zh-master/docs/img/fig3_3.png
195.06KB
stanford-cs234-notes-zh-master/docs/img/fig3_4.png
102.16KB
stanford-cs234-notes-zh-master/docs/img/fig3_5.png
180.56KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_1.png
118.23KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_2.png
95.23KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_3.png
83.34KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_4.png
89.74KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_5.png
80.59KB
stanford-cs234-notes-zh-master/docs/img/fig3_alg_6.png
101.93KB
stanford-cs234-notes-zh-master/docs/img/fig3_tab_1.png
49.62KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_1.png
101.9KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_2.png
100.81KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_3.png
132.54KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_4.png
134.56KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_5.png
134.59KB
stanford-cs234-notes-zh-master/docs/img/fig4_alg_6.png
151.65KB
stanford-cs234-notes-zh-master/docs/img/fig5_1.png
287.22KB
stanford-cs234-notes-zh-master/docs/img/fig5_2.png
85.82KB
stanford-cs234-notes-zh-master/docs/img/fig5_alg_1.png
91.35KB
stanford-cs234-notes-zh-master/docs/img/fig5_tab_1.png
24.62KB
stanford-cs234-notes-zh-master/docs/img/fig6_1.png
260.36KB
stanford-cs234-notes-zh-master/docs/img/fig6_2.png
57.02KB
stanford-cs234-notes-zh-master/docs/img/fig6_3.png
167.27KB
stanford-cs234-notes-zh-master/docs/img/fig6_alg_1.png
183.38KB
stanford-cs234-notes-zh-master/docs/img/fig7_alg_1.png
78.52KB
stanford-cs234-notes-zh-master/docs/img/fig7_alg_2.png
81.4KB
stanford-cs234-notes-zh-master/docs/img/fig7_alg_3.png
103.2KB
stanford-cs234-notes-zh-master/docs/img/fig8&9_1.png
23.27KB
stanford-cs234-notes-zh-master/docs/img/fig8&9_2.png
25.63KB
stanford-cs234-notes-zh-master/docs/img/fig8&9_3.png
26.08KB
stanford-cs234-notes-zh-master/docs/img/fig8&9_alg_1.png
62.06KB
stanford-cs234-notes-zh-master/docs/img/fig8&9_alg_2.png
108.28KB
资源内容介绍
斯坦福大学CS234强化学习课程2019年冬季中文翻译讲义项目_包含马尔可夫决策过程值函数策略梯度深度Q网络蒙特卡洛方法时序差分学习模型预测控制多臂赌博机部分可观测.zip上传一个【Rust】VIP资源用户评论 (0)
发表评论
相关资源
自动关机程序 可以方便设备关机时间,比网上很多小软件简单,易用
用易语言编写的自动关机程序 , 很好用分享给大家。
1.62MB17积分
电视盒子的刷机固件下载网盘地址及密码
提供的是电视盒子刷机的固件资源,此资源不定时更新。固件按品牌,类型分类方便 下截。
191.33KB30积分
山东大学网络空间安全学院22级创新创业实践课程作业项目集-包含SM4软件实现与优化SM4-GCM工作模式优化基于数字水印的图片泄露检测鲁棒性测试用circom实现posei.zip
postman山东大学网络空间安全学院22级创新创业实践课程作业项目集_包含SM4软件实现与优化SM4-GCM工作模式优化基于数字水印的图片泄露检测鲁棒性测试用circom实现posei.zip
7.81MB39积分
Matlab绘制雷达图(可执行代码)
雷达图(又叫 Spider chart / Star plot)常用于展示一个对象在多个维度上的性能(例如性能指标、问卷评分、能力矩阵等),能把多维数据直观地展示为多边形。在 MATLAB 中没有单一内置函数能满足所有自定义需求(部分工具箱有专用函数),所以写一个通用、可定制的绘图函数最实用。下面我给出:1) 一个通用的 radarChart 函数(可绘制 1 个或多个对象、多组比较),2) 演示脚本(直接可运行),并解释常见定制项与使用建议。
3.43KB12积分