课程介绍
计算机视觉在我们的社会中已变得无处不在,其应用领域包括搜索、图像理解、应用程序、地图、医学、无人机和自动驾驶汽车。许多应用程序的核心是视觉识别任务,如图像分类和目标检测。神经网络方法的最新发展极大地提高了这些最先进的视觉识别系统的性能。
本课程深入探讨基于神经网络的计算机视觉深度学习方法的细节。在本课程中,学生将学习实现、训练和调试自己的神经网络,并详细了解计算机视觉领域的前沿研究。我们将介绍学习算法、神经网络体系结构以及用于视觉识别任务的训练和微调网络的实用工程技巧。
Justin Johnson 是密歇根大学助理教授、Facebook AI Research 客座科学家,研究涉及视觉推理、视觉和语言、图像生成、使用深度神经网络的 3D 推理。作为斯坦福大学李飞飞教授的学生,Justin Johnson 曾和李飞飞一起讲授斯坦福大学计算机视觉经典课程 CS231n。
课程主题
相较于斯坦福目前公开的 CS231n 课程,此门课程内容有更新、更前沿的内容覆盖,可以当作『CS231n进阶课程』来学习。
- Course Introduction(计算机视觉中的深度学习介绍)
- lmage Classification(图像分类)
- Linear Classifiers(线性分类器)
- Optimization(训练与优化)
- Neural Networks(神经网络介绍)
- Backpropagation(反向传播)
- Convolutional Networks(卷积神经网络)
- CNN Architectures(CNN典型结构)
- Hardware and Software(深度学习硬件与软件)
- Training Neural Networks(训练神经网络)
- Recurrent Networks(循环神经网络)
- Attention(注意力机制)
- Visualizing and Understanding(可视化与模型理解)
- Object Detection(目标检测)
- Image Segmentation(目标检测与图像分割)
- 3D vision(3D计算机视觉)
- Videos(深度学习中的视频处理)
- Generative Models(生成模型)
- Reinforcement Learning(强化学习)
课程资料 | 下载
扫描上方图片二维码,关注公众号并回复关键字 🎯『EECS498』,就可以获取整理完整的资料合辑啦!当然也可以点击 🎯 这里 查看更多课程的资料获取方式!
ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包:
- 📚 课件(.PDF)。Lecture 1~22全部章节。在CS231n的基础上有所延展,来做一下知识升级吧!
- 📚 作业及参考解答(.ipynb)。Assignment 1~5答案。来练练手巩固下知识吧!
课程视频 | B站
ShowMeAI 将视频上传至B站,并增加了中英双语字幕,以提供更加友好的学习体验。点击页面视频,可以进行预览。推荐前往 👆 B站 观看完整课程视频哦!
本门课程,ShowMeAI 将部分章节进行了切分,按照主题形成更短小的视频片段,便于按照标题进行更快速的检索。切分后的视频清单列写在这里:
序号 | 视频章节 | 视频清单 |
---|---|---|
L1 | 第01讲 | 计算机视觉中的深度学习介绍 |
L2 | 第02讲 | 图像分类 |
L3 | 第03讲 | 线性分类器 |
L4 | 第04讲 | 训练与优化 |
L5 | 第05讲 | 神经网络介绍 |
L6 | 第06讲 | 反向传播 |
L7 | 第07讲 | 卷积神经网络 |
L8 | 第08讲 | CNN典型结构 |
L9 | 第09讲 | 深度学习硬件与软件 |
L10 | 第10讲 | 训练神经网络(上) |
L11 | 第11讲 | 训练神经网络(下) |
L12 | 第12讲 | 循环神经网络 |
L13 | 第13讲 | 注意力机制 |
L14 | 第14讲 | 可视化与模型理解 |
L15 | 第15讲 | 目标检测 |
L16 | 第16讲 | 目标检测与图像分割 |
L17 | 第17讲 | 3D计算机视觉 |
L18 | 第18讲 | 深度学习中的视频处理 |
L19 | 第19讲 | 生成模型(上) |
L20 | 第20讲 | 生成模型(下) |
L21 | 第21讲 | 强化学习 |
L22 | 第22讲 | 课程总结 |
根据视频内容整理的这份『EECS498 课程结构图解』,展示了内容要点及其逻辑关系,超级直观!相信对构建 Whole Picture 特别有帮助~
本课程前半部分将涵盖推动现代计算机视觉深度学习系统的基本组成部分:
- 关于如何搭建和训练不同类型网络的详细信息
- 全连接网络、卷积网络、循环网络
- 如何训练和调试,非常详细
在课程的后半部分,我们将讨论深度学习在计算机视觉不同问题上的应用,以及更多新兴主题:
- 目标检测、图像分割、3D视觉、视频
- 注意力,Transformers
- 视觉和语言
- 生成模型:GANs、VAEs等
- 提供概述和参考,但跳过一些细节,不太详细
学习建议
课程学习具有以下知识基础:
- 编程:熟悉Python编程。熟悉算法和数据结构,熟悉numpy或类似的数值编程框架会有所帮助,但并非严格要求。
- 概率:概率分布、随机变量、期望等。
- 向量演算:课程需要计算向量值函数的梯度。
- 机器学习:熟悉机器学习会有所帮助,但不是必需的;课程将回顾本需的重要概念。