课程介绍
强化学习提供了算法的数学基础,深度模型则将这些算法扩展到现实世界的系统表示。过往十年,深度学习和强化学习均取得了瞩目的进展,算力明显提升,这写对于深度强化学习的研究有巨大推动。
深度强化学习,是人工智能发展的重大方向之一,备受各大科研机构与公司青睐,也被很多人认为是实现通用人工智能最有可能的路径。
CS285 课程来自著名的顶级院校UC伯克利,结合了最新的研究进展,讲解深度强化学习领域的前沿知识和实践。课程覆盖了使用深度学习神经网络进行强化学习的各类方法模型,对强化学习感兴趣的同学可以借此全面了解神经网络在其中的应用。
课程讲师 Sergey Levine,UC Berkeley 电气工程和计算机科学系的助理教授。专注于控制Control和机器学习之间的交叉,开发算法和技术,使机器能够自主获得执行复杂任务的技能。
课程主题
课程官网发布了课程主题,ShowMeAI 对其进行了翻译。
- Introduction and Course Overview(课程速览与介绍)
- Supervised Learning of Behaviors(行为监督学习)
- Introduction to Reinforcement Learning(强化学习介绍)
- Policy Gradients(梯度策略)
- Actor-Critic Algorithms(Actor-Critic 算法)
- Value Function Methods(价值函数方法)
- Deep RL with Q-functions(基于Q函数的的深度强化学习)
- Advanced Policy Gradients(前沿梯度策略)
- Model-based Planning(基于模型的规划)
- Model-based Reinforcement Learning(基于模型的强化学习)
- Model-based Policy Learning(基于模型的策略学习)
- Exploration(探索与利用)
- Offline Reinforcement Learning(离线强化学习)
- Introduction to RL Theory(强化学习理论)
- Deep RL Algorithm Design(深度强化学习算法设计)
- Probability and Variational Inference Primer(概率与变分推断初步)
- Connection between Inference and Control(推断与控制联系)
- Inverse Reinforcement Learning(逆强化学习)
- Transfer Learning and Multi-Task Learning(迁移学习与多任务学习)
- Meta-Learning(元学习)
- Challenges and Open Problems(挑战与开放待解决的问题)
课程资料 | 下载
扫描上方图片二维码,关注公众号并回复关键字 🎯『CS285』,就可以获取整理完整的资料合辑啦!当然也可以点击 🎯 这里 查看更多课程的资料获取方式!
ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包:
- 📚 课件。Lecture 1~23所有章节。
- 📚 代码作业与参考答案-数据文件&.py文件。Homework 1~5所有作业的参考答案。
课程视频 | B站
ShowMeAI 将视频上传至B站,并增加了中英双语字幕,以提供更加友好的学习体验。点击页面视频,可以进行预览。推荐前往 👆 B站 观看完整课程视频哦!
本门课程,ShowMeAI 将部分章节进行了切分,按照主题形成更短小的视频片段,便于按照标题进行更快速的检索。切分后的视频清单列写在这里:
序号 | 视频章节 | 视频清单 |
---|---|---|
L1 | 第01讲 | 课程速览与介绍 |
L2 | 第02讲 | 行为监督学习 |
L3 | 第03讲 | TensorFlow和神经网络复习 |
L4 | 第04讲 | 强化学习介绍 |
L5 | 第05讲 | 梯度策略 |
L6 | 第06讲 | Actor-Critic 算法 |
L7 | 第07讲 | 价值函数方法 |
L8 | 第08讲 | 基于Q函数的深度强化学习 |
L9 | 第09讲 | 前沿梯度策略 |
L10 | 第10讲 | 基于模型的规划 |
L11 | 第11讲 | 基于模型的强化学习 |
L12 | 第12讲 | 基于模型的策略学习 |
L13 | 第13讲 | 探索Ⅰ |
L14 | 第14讲 | 探索Ⅱ |
L15 | 第15讲 | 离线强化学习 |
L16 | 第16讲 | 强化学习理论 |
L17 | 第17讲 | 深度强化学习算法设计 |
L18 | 第18讲 | 概率与变分推断初步 |
L19 | 第19讲 | 推断与控制联系 |
L20 | 第20讲 | 逆强化学习 |
L21 | 第21讲 | 迁移学习与多任务学习 |
L22 | 第22讲 | 元学习 |
L23 | 第23讲 | 挑战与开放待解决的问题 |
根据视频内容整理的这份『CS285 课程结构图解』,展示了内容要点及其逻辑关系,超级直观!相信对构建 Whole Picture 特别有帮助~
学习建议
对强化学习 ReinforcementLearning、数值优化 Numerical Optimization 和 机器学习 Machine Learning 有一定的了解。