CNN 卷积神经网络

卷积神经网络基础结构

  • CNN(convolutional neural network, 或者ConvNet)是一种深度、前馈人工神经网络,适用于类似网格结构的数据,例如时间序列数据处理、图像识别、视频识别以及自然语言处理。卷积神经网络是从生物神经网络的结构和激励机制中得到灵感和启发的。Deeplearning书中这样描述CNN的动机:稀疏交互(Sparse Interaction)、参数共享(Parameter Sharing)、等变表示(Equivariant Representation)。稀疏交互极大降低了计算复杂度。参数共享能达到正则化的效果。等变表示使得神经网络层具有对平移等变的性质。
  • 常见的CNN包括三层结构以及三层结构的组合:卷积层、非线性激活函数层、池化层。卷积层(由卷积核kernel决定,或者叫滤波器filter)用来感知某种特殊的特征,让这些有着某种特征的区域激活值较高,当然从低层到深层的网络意味着低级特征到高级特征模式的识别。卷积的主要目的就是提取图像的特征。卷积核以及卷积核个数Depth,步长Stride, 零填充Zero-padding决定着卷基层。非线性激活单元(例如ReLU)引入了非线性。池化(Pooling)使得神经网络具有平移不变性(Translation Invariance),降低特征表示的维度(同时也就控制了过拟合)。当然卷积神经网络最后要包括输出层,也就是全连接层,常常是softmax或者其他分类器。
  • 对于卷积神经网络,这篇博客讲的异常棒,这是链接这是翻译版本

经典卷积神经网络

卷积神经网络具体应用

1. 图像识别

2. 自然语言处理

参考资料