建议选课人群:想了解生信的,爱好数据科学的同学
内容
有签到,有回放,课程从干实验讲到湿实验讲到组学,自底向上,非常有系统:
- 先讲一堆神经网络
- 然后再讲一堆湿实验(测序等等,有点没太记清楚)
- 还有序列比对的各种算法
- 再讲 AF2, scGPT, Geneformer, ESM 之类的生物信息学大模型,以及 GNN 知识图谱
目前机器学习(大模型)是风口中的风口,而生信更是经典的交叉学科,和神经网络、数据科学等融合非常深,不管是生院同学还是信院同学,听下来(至少看 lecture slides 下来)都应该增加了不少甚至是对自己学科的理解。郑老师也是信息科学出身去做生信的,所以对神经网络这方面的理解确实很好。而且大部分都是科普级别的,内容方面并没有多难理解,但是考核有点复杂了
Project
project 三选一,需要组队(不超过 3 人)选了个看起来简单的但是原论文难以复现,化身调参侠疯狂调参占用了很大的 workload;project 要求的另外期中需要中期汇报(虽然不算分,但是算评分依据),要找 4-5 篇参考文献的同时录个视频,这个工作量有点小大。截止日期是 16 周。
Quiz
随着中期汇报同一时间,最后一节课有个开卷 quiz 相当于期末考,但是占分不高(12%),然而只能查看纸质资料,也就是说要打印一大堆 slides 或者靠记忆 / 抽一堆时间提取出核心知识点。
不过很好的是复习过程比较简单,看一遍加上考试的时候查 ppt 就行了,但是需要有比较强大的彩打能力……
Homework
作业都比较简单,这次比前几年难了,HW3 用时不少,算上 pj 的 workload 虽然也不少了,但是处于专业课平均线以下,这点而言也可以推荐了。HW3 比较好的一点就是开了 kaggle,让我们感受到了数据科学竞赛之美。
工作量
2 月中开学,差不多 5 月就(上课)结课了,后面还有 project 的报告之类的要写。工作量大就大在这门课会在结课的同时有个 workload 尖峰,然后和其他课的 workload 尖峰爆在一起有点难受。但是总体而言还是不大的
给分不错