排序和筛选
田政 (5)
其他 (0)
田政, 顾小煜 (0)
24秋新版上线,创艺部分增加,你也来试试吧!
2024 年 秋学期
田政
考察形式
(CS 部分)(交互部分)包括一次期中考试和一次期末作业,期中考试主要是 RL 基础,基本上是 “动手学强化学习” 的基础篇。期末作业主要是 actor_critic、dqn 等算法的调参和训练,大约花了一周时间。
(创艺部分)(仿真部分)由顾小煜老师负责,但是由于一开始考察的目标似乎和田政没有商量好,导致一部分交互项目下的 RL 实现基本完全废弃。后续的产出要求修改为:整个概念和数字孪生相关的框架设计(包含数据建模) 以及有 1-2 个亮点重点的服务触点具体设计。
匿名用户
比较肝但是容错较大给分很好的课程
2024 年 秋学期
田政
从 24 年秋学期开始,这门课的创艺部分和 RL 部分对半分。 创艺部分主要是在一个主题下,例如 “交通运输”,构建一个有创意的交互设计(小组合作,虽然选这门课的学生都是信院的,这部分对完成度的要求不会很高,有自洽的方案 + PPT 就好),但还是对创意比较看重。 RL 的部分分为无神经网络和有神经网络(≈深度强化学习,DRL)两个部分,前一个部分通过期中考试考察,后一个部分通过作业考察。后一个部分的神经网络对于我个人而言有点难调,期末作业如果时间紧迫,可能会调不出来。 尽管如此,如果课堂认真参与 + 期中理论部分掌握的比较好 + 项目认真对待的话,即使期末丹炼不出,还是会有不错的成绩。
匿名用户
Workload小,但Project不太好做
2023 年 秋学期
田政
前半学期讲深度学习,没有作业,期中考试 5 选 3,考前会讲去年的考试题,但每年的考试范围不一样。
后半学期讲强化学习,有两次作业,作业有证明题和编程题。
Project 分为环境仿真和策略优化两个部分。环境仿真是通过输入数据预测室内温度,给的训练数据是来源于供热公司的真实数据,而且深度学习似乎也不是最好的解决方法,因此大家学习出的预测结果都没有课件上的那么准确。策略优化是在保持室内温度不被投诉的情况下降低能耗,这部分强化学习也不是最好的解决方法,而且评分标准不是很明确。
匿名用户
内容:深度学习一半,强化学习一半
2022 年 秋学期
田政
田政老师讲课很好,推荐学习该课程来入门 ML DL,如果是已经学过 DL 的同学这门课的前半学期相当于可以纯划水度过。(话说我期中考试纯摆烂没复习的,也能拿到一个还可以的分数。而且没有期末考试,也就是说强化学习是完全不考的,很爽
RL 确实还是稍难的,但是考核不难,不需要怕。
非常推荐信息学院的同学选择该课程刷创意课程群的学分。
创艺学院下的信院课
2022 年 秋学期
田政
推荐指数:8/10
推荐人群:大三
虽然课程名字叫做《环境仿真与交互》,但实则只有项目部分和“环境”相关,课程主体是深度学习和强化学习,所以我认为更应该叫《深度/强化学习概论》。田政老师讲课非常好,介绍概念的同时也非常注重各种公式的推导,对初学者很友善。课程总体的工作量很小,除了项目要花大约半周到一周的时间去研究之外,作业基本一天就能做完。
不足的地方在于课程作业的发布和连贯性较差,第一次作业刚写完马尔科夫链、价值迭代和策略迭代,第二次作业就要把SARSA、Q-Learning、DQN、REINFORCE、Actor-Critic全部实现一遍。另外,个人认为课程项目的相关数据其实并不适合作为一个考察的标准,只是教会你怎么把深度学习和强化学习融入到实际问题当中去解决。