什么是深度学习?
惊!都2022年了,居然还有人还不知道深度学习是什么? 不过没关系,笔者查阅了大量资料后,终于把深度学习的概念给理清楚了,看完文章你就懂了。

深度学习是什么?

     说起深度学习,可能还有很多人不是很有概念,但说到人工智能、AI是不是就都听过了😏,人工智能的概念似乎已经在近几年越来越多的充斥着我们的生活。那它们之间有什么关系呢?接下往下看你就知道了。

     首先,先普及一下人工智能、机器学习、深度学习三者之间的关系。深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。

     人工智能(AI,Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,自动规划,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解,遗传编程等。

     机器学习(ML, Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。

     深度学习(DL, Deep Learning)是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。

     深度学习(Deep Learning)的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构,而其中的“Deep”就表示网络的层数,层数越多表明深度越深,“Learning”表达的是一个输入-输出的过程。深度学习通过组合低层特征形成更加抽象的高层特征,以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等。(如图1)



图1.深度学习基础神经网络


      既然说到深度学习是模拟人脑的机制来解释数据,那么人脑的机制是怎样的呢?这里需要引进一个概念——生物神经网络,生物神经网络(Biological Neural Networks)一般指生物的大脑神经元,细胞,触点等组成的网络,用于产生生物的意识,帮助生物进行思考和行动。

      人脑大约有500亿-1000亿个神经元,每个神经元(细胞)都向外伸出许多分支,其中用来接收输入的分支称作树突(dendrities),用来输出信号的分支称作轴突(axon),轴突连接到树突上形成一个突触(synapse)。每个神经元可以通过这种方式连接多个其他神经元,每个神经元也可以接受多个其他神经元的连接。很多连接起来的神经元形成了网状结构,海量具有传感和伸缩功能的体细胞通过神经纤维连接在这个网状结构的输入和输出端,中枢神经系统正是通过这种网状结构获得了“智能”,至少是驱动机体做出了趋利避害的选择。(如图2)


图2.生物神经网络工作原理


      人的视觉系统的信息处理是分级的。从低级的V1区提取边缘特征,再到V2区的形状或者目标的部分等,再到更高层,整个目标、目标的行为等(如图3)。也就是说高层的特征是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图。而抽象层面越高,存在的可能猜测就越少,就越利于分类。(如图4)

 

图3.人脑视觉系统信息处理流程

 
图4.人脸识别案例


      人工神经网络是在理解和抽象了人脑结构及其对外界刺激的响应机制后,以生物神经系统的基本原理和结构为范本原型,以网络拓扑为理论基础,对复杂信息进行非线性关系表示和逻辑操作的一种数学模型。该模型实际上是一个由大量简单同质元件相互连接而成的复杂网络,它将信息的加工和存储结合在一起,具有独特的知识表示方式和智能化的自适应学习能力。(如图5)


图5.人工神经网络模型


      人工神经网络机理:神经网络的训练依靠反向传播算法,最开始输入层输入特征向量,网络层层计算获得输出,输出层发现输出和正确的类号不一致,这时它就会让最后一层神经元进行参数调整,最后一层神经元不仅自己调整参数,还会勒令连接它的倒数第二层神经元调整,就这样层层回退调整。经过调整的网络会在样本上继续测试,如果输出还是错误,继续进行回退调整,直到输出结果满意为止。      

      通过传感器(例如CMOS)来获得数据,然后经过预处理、特征提取、特征选择,再到推理、预测或者识别(如图6)。中间的三部分,概括起来就是特征表达。良好的特征表达,对最终算法的准确性起了非常关键的作用,而且系统主要的计算和测试工作都耗在这一大部分。但这块实际中一般都是人工完成的,靠人工提取特征,非常耗时费力。



图6.特征表达


      那深度学习的方法有哪些呢?

      自上而下的监督学习。就是通过带标签的数据去训练,误差自上而下传输,过程中对网络进行微调。基于第一步得到的各层参数进一步微调整个多层模型的参数,这一步是一个有监督训练过程。第一步类似神经网络的随机初始化初值过程,由于第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。所以深度学习的良好效果在很大程度上归功于第一步的特征学习的过程。

     自下上升的非监督学习。就是从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层,由于模型容量的限制以及稀疏性约束,使得得到的模型能够学习到数据本身的结构,从而得到比输入更具有表示能力的特征;在学习得到n-l层后,将n-l层的输出作为第n层的输入,训练第n层,由此分别得到各层的参数。

     半监督学习。既有标记数据,也有大量的未标记数据,将这两类数据都利用起来就是半监督学习。

     强化学习。数据需要从环境中获取,数据对应的标记也要从环境中获取,并不提供标记数据,只提供某种评价机制(奖励或惩罚),这种学习方式叫做强化学习。

     以上就是关于深度学习相关概念的介绍,后续还会给大家介绍深度学习的一些相关应用和前沿研究,敬请期待。

版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇

WIN10系统建立FTP服务器

下一篇

深度学习的前沿研究与应用

评论请先登录 登录
全部评论 4

看完文章确实扫了盲,区分了人工智能,深度学习和机器学习的关系和概念,涨知识了!

2022-02-24 10:25:59
回复

我之前都傻傻的区分不了,看完此文章后,一下子就明白了,给作者加鸡腿

2022-02-23 18:55:41
回复

学习了😀

2022-02-22 17:00:04
回复

人工智能、机器学习和深度学习概念确实容易混淆,作者这边文章让我涨知识了。

2022-02-21 15:26:17
回复
  • 1
2
创作
3
粉丝
23
获赞
相关阅读
  • 海康机器人“悉灵杯”课题研究活动详情
    2022-05-18
  • 单目抓取应用案例
    2022-04-28
  • ID1013D硬解模组产品性能及特点介绍
    2022-04-25
  • 模型优化方法---VisionTrain训练篇
    2022-04-28
  • 工业相机参数设置获取通用接口调用说明
    2022-05-06

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器