第14章 一不小心站在了技术发展的最前沿
本站推荐:人在高中,离婚逆袭系统什么鬼?、开局即大帝,就你让我赴三年之约?、嫌我废物要退婚,我成神你哭什么、混在四合院:我是史蒂夫、秦末:打猎养家,我替汉高祖斩白蛇、华娱:塌房系顶流,又又又塌了、三子非亲生,重生后报复一下咋啦、学姐对我超温柔、人在斗罗,我是龙神之子、我的宝可梦朋友来自宝可梦、神话红楼:从箭术开始修行、逼她替嫁?福运全被真千金带走啦、我在东京成为常世之主、我野神,香火证道镇轮回、御兽从成为开拓区领主开始、996的福报从每天100万开始、重生换嫁,娇娇被大佬宠成小废物、逼她给白月光顶罪?渣父子我不要了、年过五十被丈夫拋弃后,她转身嫁给云城首富、先婚后爱,三爷的报恩小娇妻、
o年,人工智慧领域正处於深度学习的快展时期,但在训练深层神经网络时,仍存在一些无法绕过的核心难题,其中“梯度消失”
和“梯度爆炸”
问题尤其突出。
当马库斯和林枫的对话逐渐转向这些人工智慧瓶颈时,他们自然聊到了这个话题。
对於人工智慧涉及到的梯度消失和梯度爆炸这个问题,对於前世就从事人工智慧方面工作的林枫来说,他自然是不陌生。
梯度消失和梯度爆炸是神经网络训练中常见的问题。
了解梯度消失和梯度爆炸先要了解神经网络。
简单说,神经网络是一种模仿人脑工作原理的计算模型。
它由很多“神经元”
组成,这些神经元分成多层,数据会从一层传到另一层,最终得到一个结果。
训练神经网络的过程就是不断调整这些神经元之间的“连接强度”
,让网络的输出越来越接近我们想要的结果。
为了调整神经网络中的这些连接强度,我们需要用到一种叫“梯度”
的东西。
简单来说,梯度就是用来指引我们“往哪里走”
的方向,就像你爬山时要知道往哪边是上坡、哪边是下坡。
我们通过“梯度”
来知道哪些参数需要调整,从而让网络的表现变得更好。
那“梯度消失”
和“梯度爆炸”
又是什么呢?
假设你在玩一个滑滑梯,当你站在滑梯的最高处,往下滑时,你能很快感受到度在增加,因为坡度很大。
但是,如果滑到快要到底部的地方,坡度变得很小,你几乎就感觉不到滑动的度了。
这里的“坡度”
就像是“梯度”
——当坡度变小,滑动的度也变小。
在神经网络中,类似的事情也会生。
如果我们给网络很多层,它们之间的梯度会越来越小,传到前面几层时,梯度几乎“消失”
了。
这就是“梯度消失”
问题。
梯度太小,无法有效调整那些神经元的连接强度,网络的训练就会变得非常困难。
想像你在爬一个大山,山的坡度越来越平,最终你几乎感受不到自己在上升了,这时你很难再判断该怎么继续往上爬。
在神经网络里,梯度消失的问题就是这种感觉,网络不知道该如何继续改进。
而梯度爆炸又是另外的一个极端。
假设这次你站在一座非常陡的悬崖边,一不小心就滚下去了!
因为坡度太陡了,你的度变得非常快,失控了。