首页 科技 正文

神经网络“高炉”的内部结构是怎样的?牛津大学修女博士论文解读

萧箫 只想说 凹非寺量子位 报导 | 微信公众号 QbitAI

神经网络如同“炼丹炉”一样,投喂很多数据信息,也许能得到 奇妙的实际效果。

“炼药”取得成功后,神经网络也可以对没见过的数据信息开展预测了~

殊不知,这类状况下,神经网络实际上变成“飞机黑匣子”——具备一定的作用,但看不到是怎么起功效的。

假如只做简易的图像分类,实际上还行;但假如用在医药学方位,对病症开展预测,那麼神经网络下的“分辨”就不能听信。

假如能掌握它是怎么工作中的,就更强了。

出自于这类考虑到,来源于剑桥大学的博士研究生Oana-Maria Camburu编写了论文《解释神经网络(Explaining Deep Neural Networks)》。

在这篇毕业论文中,她将这种“飞机黑匣子”一个个开启,对神经网络原理开展了详尽的解释。

为何要开启神经网络“飞机黑匣子”?

实际上,神经网络往往起功效,最形象化的缘故便是,它由很多非线性函数构成。

这种非线性函数,促使互联网能够 学习培训原始记录中各种各样抽象性级特点。

殊不知,也更是由于神经网络中的这种非线性函数,促使人们通常难以理解,他们是怎样起功效的。

这就造成 神经网络在病症预测、授信额度、刑诉法等方位上“不太火爆”。

医师和法律法规有关的学者通常更愿意选用可解释实体模型,比如线性回归、决策树算法,由于神经网络在病症预测中确实有过难题:

大家运用神经网络预测肺部感染病人的病况发展趋势,在其中一项病人特点为是不是有哮喘病史。

神经网络训练有素后预测,有哮喘病史的病人丧生于肺部感染的概率较低。

但实际上結果恰好相反,哮喘病自身会给肺部感染产生始料不及的实际效果。

往往数据信息说明哮喘病病人较少丧生于肺部感染,通常是由于哮喘病能被尽早发觉,因此病人得肺部感染后能被尽早医治。

假如这类神经网络被运用于实践活动中,可能产生十分风险的結果。

除此之外,即便 是神经网络,也会对男人女人性別造成偏见、造成人种成见。

比如,调研说明,一些词库和实体模型,在预测再次发生时,会更“钟爱”男士。

除开不正确的预测和人种、性别歧视倾向之外,神经网络还很敏感。

不论是对图象开展小修改蒙骗随机森林算法、還是用语音识别技术瞒住NLP实体模型,神经网络被“崩盘”的状况也许多 。

为了更好地让神经网络运用于大量的方位,也为了更好地使我们能够更好地学习培训它的原理,创作者从2个方位对神经网络开展了解释。

2种方法解释神经网络

“过后再解释”

第一种方法,称作根据特点的解释方法,又叫“过后再解释”——由于这类方法,是在神经网络训炼好后,才对其键入特点开展解释的。

这类方法对于文字的词(token)、或者对于图象的超清晰度(super pixels),开展“过后”解释。

现阶段这类方法运用比较广泛,不易出現解释成见,但必须认证解释方法的真实有效。

这儿的压根原理,是科学研究外界解释方法得出的解释、与实体模型自身转化成的自然语言理解解释中间,是不是存有关联性,而关联性实际又是啥。

在毕业论文中,创作者引进了一种新的认证方法,来分辨解释方法的真实有效。

让神经网络自身解释

那麼,假如能让神经网络一边训炼、一边“解释自身”呢?

它是毕业论文提及的第二种方法,即在实体模型中嵌入一个转化成预测解释的控制模块,对预测的結果开展解释。

对于神经网络对自身的解释是不是恰当,还必须人为因素开展分辨。

在这里里边,创作者一样引进了一种分辨方法,模型拟合自身转化成的解释开展分辨,进而得到神经网络解释的結果。

对神经网络详尽构造、实际解释方法很感兴趣的小伙伴们,能够 戳正下方毕业论文详细地址查询~

Oana-Maria Camburu,来源于爱沙尼亚,现阶段是剑桥大学的博士研究生,主学深度学习人工智能技术等方位。

普通高中阶段,Oana-Maria Camburu曾获IMO(国际性小学奥数比赛)金牌。她以前在马普所、Google见习,读博士期内,毕业论文被ACL、EMNLP、IJCNLP等顶会百度收录。

非特殊说明,本文由原创资讯网原创或收集发布。

转载请注明本文地址:http://www.68nw.com/kj/1477.html