CourseBench Logo

强化学习

SI252 | 4 学分 | 3 评论
开课单位:

信息科学与技术学院

授课老师:
Ratings & Reviews

4.2

/5
褒贬不一

3 人评分

5

4

3

3

2

1

课程质量

很好

作业用时

4-8h

考核难度

简单

给分情况

很好
排序和筛选

20142026

邵子瑜 (3)

其他 (0)

2025/06/24 06:40
2025/06/24 06:39
能补很多看论文的知识,但是节奏前慢后快

2025 年 春学期

邵子瑜

课程质量
很好
作业用时
>8h
考核难度
简单
给分情况
很好

szy 不折不扣大好人,讲课讲的肯定是清楚的,给分给的是绝对好的(周围均 4.0),project 是不会做也能给很好的分的。

但是为什么要在概率论基础知识补齐那里用那么久...... 导致的就是后面 bandit 和 RL 部分都很紧张。到最后面的 DeepRL 基本是一节课一个 PPT,我这种几乎不去上课的基本啥都没学到(所以被迫暑假补课赎罪)

给的 spinning up 和 huggingface 的资源都很有用,建议可以自己玩一玩。基本熟悉 RL problem setup 以后就可以看里面的式子了(但是都没自己实践过写代码,还在赎罪 ing)


?

匿名用户

2025/06/23 02:28
2025/06/23 02:28
伟大,无需多言

2025 年 春学期

邵子瑜

课程质量
很好
作业用时
4-8h
考核难度
简单
给分情况
很好

上科大 / CS 难得的研究生好课。邵子瑜的教学质量一如既往的在线。上了这么多门本 / 研究生课,邵子瑜绝对是数一数二对学生、对课程比较负责人的老师了。

定位是 SI 打头的数学课,对概率论的要求较高,但一上来会先复习一下 SI140A 的内容。

szy 一上来就在强调是数学课进行劝退,想快速入门的话可以去上强化学习应用实践 (CS290T) 那门课。


S

SsagerR

2023 级本科生
2025/06/22 18:31
2025/06/22 18:31
总体来讲非常好的课程

2025 年 春学期

邵子瑜

课程质量
很好
作业用时
4-8h
考核难度
简单
给分情况
很好

课程质量极高,上过 SI140A 的应该都知道 szy 老师负责的课程的教学质量,毋需多言。

美中不足的就是课程的时间安排可能有点小问题。概率论回顾和 MCMC 部分的内容讲了很久,占用了较多时间。课程过了半程才开始讲 Bandit,真正开始讲 RL 核心内容的时间就更晚了,导致最后几节课几乎一节课就要讲一个课件,节奏非常快。

这门课的定位是一门数学课,因此对数学推导过程的讲解非常细致,但实际动手操作的比较少。推荐同时修读强化学习工程实践或充分利用好 Hugging Face Deep RL Course资源。