Lecture Notes: Part VIII
Convolutional Neural Networks
CS224n 级院斯坦品的度学习与然语理方
RNN LSTM CNN
transformerbert、问答、文本语言阅读
理解等前沿内容。
笔记核心词
CNN, , n-gram, filter, Multiple-Channels, k-max
pooling, 卷积神经网络, 文本分类
课程部资料和扫描
获取!!
微信公众号·全套资料
回复 CS224n
底部菜单栏
Bilibili·课程视频
视频简介
置顶评论
GitHub·项目代码
阅读 ReadMe
点击超链接
1. CNNs (Convolutional Neural Networks)
1.1 Why CNNs?
卷积神经网络接收词向量的序列,并首先为所有子短语创建短语
(递归
)CNNs
务。
1.2 What is Convolution?
开始
主向量,g filter 之间积,n 项处的值示为
()[]
,它等于
=−
[][]
1
9×9
绿
主矩阵
3×3
的红色矩阵表示 filter g,当前正在计算的卷积
位于[2,2] 1 显示[2,2]= 4
你能完成第二张表格吗?
1.3 A Single-Layer CNN
n
联,
1:
=
1
2
。最考虑卷积
ℎ
h
=2,=5,=3
2 NLP
"the country of my birth"
w
=
:|ℎ−1
+
=
1
,
2
…
−ℎ+1
−ℎ+1
“my”
“birth”开始,我没有足够向量来与波器(因为 h =
3)。如果我们需要与后两个词向量相关的卷积,一个常见的技
是用 h - 1 个零向量填充句子的右边,如右图 3 所示。
1.1 Notes info.
课件/Slides
Lecture 11, P16
视频/Video
Lecture 11, 8:00
GitHub·代码
实时在线查阅文档
Bilibili·视频
中英字幕课程视频
Stanford University X ShowMeA
I
1.2 Notes info.
课件/Slides
Lecture 11, P9
视频/Video
Lecture 11, 11:00
GitHub·代码
实时在线查阅文档
Bilibili·视频
中英字幕课程视频
Stanford University X ShowMeA
I
Figure 1: Convolution in the 2D
case【图 1:2D 情况下的卷积】
Figure 2: Single-Layer
Convolution: one-step 2:单
卷积:一步
Figure 3: Single-Layer
Convolution: all-steps 3
卷积:所有步骤】
1.4 Pooling
使
+1
个数。常,我们希接收 CNN 输出,并将其作为
入,输到更深层,如前馈经网络RecNN但是,所有这
CNN
使 max-
poolingCNN
−ℎ−1
max-pooling 层的
max-pooling 的输出层
=max{}
,因此
我们使通常使ReLU 线
性激数而 ReLU 下界 0因此一个化可
ReLU 覆盖使用最
化。
1.5 Multiple-Filters
2 h = 2
使用一个特定的组合方法,即使用过滤器来查bi-grams。我
使 bi-grams
bi-grams使
bi-grams还可使用 tri-grams quad-grams 甚至更
CNN
层的最终输出将是一个长度等于过滤器数量的向量
1.6 Multiple-Channels
如果我们允许梯度流入这里使用的单词向量,那么单词向量可能
会随着训练而发生显著变化。这是需要的,因为它将单词向量专
门用特定( GloVe 始化),如
出现在测试集中而没有出现在训练集上呢?虽然出现在训练集中
的其他语义相关的单词向量将从它们的起始点显著移动,但是这
些单词仍将处于它们的初始点。神经网络将专门用于已更新的输
入。因此,我们在使用这些单词的句子中会表现得很差。
”()
( SGD )GloVe 或者
其他初始化)。这两个集合同时作为神经网络的输入。因此,初
始化的词向量在神经网络的训练中始终起着重要的作用。在测试
中给出看不见的单词可以提高正确理解的几率。
1.4 Notes info.
Lecture 11, P20
Lecture 11, 33:00
实时在线查阅文档
中英字幕课程视频
Stanford University X ShowMeAI
1.5 Notes info.
Lecture 11, P24
Lecture -, 00:00
实时在线查阅文档
中英字幕课程视频
Stanford University X ShowMeAI
1.6 Notes info.
Lecture 11, P25
Lecture 11, 37:00
实时在线查阅文档
中英字幕课程视频
Stanford University X ShowMeA
I
有几种处理这两channel 的方法,最常见的是在 CNN 中使
CNN
加倍。
1.7 CNN Options
Narrow vs Wide
4
?即我们是否使用 zero-pad
如果我们使用窄卷积,我们只在一个滤波器的所有分量都有一个
匹配输入分量的位置计算卷积。在输入的开始和结束边界处显然
不是这样,如4 中的左侧网络所示
如果我们使用宽卷积,我们有一个输出分量对应于卷积滤波器的
每个对。为此,我们必在输入的开和结束处填 1
零。
在窄长度
+1
,而
输出长度为 +1
k-max pooling
k-max
k
序)。设置
=1
则是我们前面看到的最大池化层。
Figure 4: Narrow and Wide
Convolu2 tion (from Kalchbrenner
et al. (2014))【图 4:窄和宽卷积】
CS224n | Natural Language Processing with Deep Learning Stanford University
Lecture Notes: Part VIII - Convolutional Neural Networks
5
机器学习
深度学习
自然语言处
计算机视觉
知识图谱
Machine Learning
Deep Learning
Natural Language Processing
Computer Vision
Knowledge Graphs
Stanford · CS229
Stanford · CS230
Stanford · CS224n
Stanford · CS231n
Stanford · CS520
# 系列内容 Awesome AI Courses Notes Cheatsheets
图机器学习
深度强化学
自动驾驶
Machine Learning with Graphs
Deep Reinforcement Learning
Deep Learning for Self-Driving Cars
Stanford · CS224W
UCBerkeley · CS285
MIT · 6.S094
...
...
...
ShowMeAI 的分盖最TOP20+ AI 旨在和学供一
高品质中文学习笔记和速查表。
斯坦(Stanford University) Natural Language Processing with Deep Learning (CS224n) 课程,
系列的第三门产出。
课程版本 2019 Winter,核度内(transformerbert、问答、、文本生)在当(2021 )
业界和研究界依旧是前沿的方法。最新版课程的笔记生产已在规划中,也敬请期待
笔记内容经由深度加工整合,以 5 个部分构建起完整的CS224n 内容世界”,并依 GitHub 创建了汇
页。快扫描二维码,跳转进入吧!有任何建议和反馈,也欢迎通过下方渠道和我们联络 (*3)~