CMU DLSys 课程笔记 1 – Introduction and Logistics
CMU Deep Learning System,教你如何实现一个深度学习系统。
目前(2024.01.06)课程在线评测账号和课程论坛的注册时间已经结束,只剩下框架代码里的本地测试供大家调试代码。
目录
为什么要学习 deep learning?
Deep learning 极大地拓宽了当前 AI 的应用范围,例如计算机视觉、自然语言处理、语音识别等等。
许多现实世界的非常 Amazing 的 deep learning 应用,Alexnet、AlphaGo、StyleGAN、GPT-3、AlphaFold 2、Stable Diffusion 等等。
除了这些非常大型的应用,还有很多小型的项目同样非常有趣,例如 Llama.cpp、Pytorch Image Models 还有许多其他社区驱动的项目和框架。
为什么要学习 dlsys?
每一次易用的 deep learning 框架的出现,都会带来一次新的 deep learning 热度的爆发,例如 TensorFlow、Pytorch、JAX 等等。
三个具体的理由:
- 开发 dlsys
- 更高效地利用现有系统
- dlsys 非常有趣
dlsys 的组成部分
- 组合多个张量操作以构建现代机器学习模型
- 通过自动微分来执行一系列操作
- 通过专用硬件加速计算
- 扩展更多硬件后端,更多操作符
课程教师
学习目标和课程主题
在本课程结束时,您将会…
… 理解现代深度学习库的基本功能,包括自动微分、基于梯度的优化等概念
… 能够从零开始实现几种标准的深度学习架构(MLP、ConvNets、RNNs、Transformers)
… 理解现代深度学习架构中硬件加速(例如在 GPU 上)的工作原理,并能够开发高效的自己的代码
广泛的主题包括:机器学习复习/背景知识、自动微分、全连接网络、优化、神经网络库、卷积神经网络、硬件和 GPU 加速、序列模型、训练大型模型、Transformers 和注意力机制、生成模型
课程前置条件
学习这门课需要了解的前置知识
- 系统编程
- 线性代数
- 一些其他数学基础:微积分、概率论、基本的证明知识
- Python 和 C++ 编程
- Machine Learning 的基础知识
课程内容
这门课程将包括四个主要元素
- 课堂讲座
- 编程作业(个人)
- (小组)期末项目
- 在课程论坛中的互动/讨论
成绩分配:作业占 55%,项目占 35%,课堂参与占 10%。
目前(2024.01.06)无法进行在线公开注册,无法参与课程论坛,课程作业无法提交到在线评测系统,只能在本地调试代码。
编程作业:
该课程将包括四个基于编程的作业,另外还有一个作业 0,用于回顾/测试您的背景知识。
作业完全基于编码:在作业中,您将逐步开发一个名为 Needle 的类似于 PyTorch 的深度学习库,具有自动微分、基于梯度的模型优化、支持标准运算符(如卷积、循环结构、自注意力)以及(手动编写的)在 CPU 和 GPU 设备上高效的线性代数运算。
作业将使用我们为本课程开发的自定义系统进行自动评分(在下一节课中进行演示和说明)。
期末项目:
除了作业外,还将有一个期末项目,由 2-3 名学生组成的小组完成(仅限 2-3 人,不能是 1 人或 4 人组)。
期末项目应涉及在 Needle 中开发一个重要的新功能,或在框架中实现一些新的架构(请注意,您必须在 Needle 中实现,不能使用 PyTorch 或 TensorFlow 等其他框架进行期末项目)。
在期末项目提案/团队组建截止日期之前,我们将发布一系列可能的项目主题/想法。
1.本站内容仅供参考,不作为任何法律依据。用户在使用本站内容时,应自行判断其真实性、准确性和完整性,并承担相应风险。
2.本站部分内容来源于互联网,仅用于交流学习研究知识,若侵犯了您的合法权益,请及时邮件或站内私信与本站联系,我们将尽快予以处理。
3.本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”您需知晓本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
5.本站是非经营性个人站点,所有软件信息均来自网络,所有资源仅供学习参考研究目的,并不贩卖软件,不存在任何商业目的及用途
暂无评论内容