当前讯息:机器学习——softmax函数


(资料图片)

在二分类问题中,我们常用sigmoid函数作为激活函数,但是由于sigmoid在自变量x离0较远时曲线过于平滑,在深度神经网络中可能会出现梯度消失的情况,需要选择一个新的函数来替代。

a表示每一层的输出值,z表示每一层的输入值,二者之间需要经过激活函数σ的运算,在这a(l)(k)表示最终的输出值,l层一共有i个感知机,a(l)就是一个i维向量,k表示第k个样本数据。J函数就是损失函数。

多分类问题中,输出层的每个感知机输出的值表示对应分类的概率值大小,一定大于等于0,并且和为1,组合到一起就是一个i维的a(l)(k)的向量。

softmax函数如上所示,首先保证没个输出值都大于等于0 ,使用以e为底的指数函数形式,然后在进行归一化处理就是softmax的函数了。

与softmax函数相比来说,sigmoid更像是一种特殊形式,只有一个分类情况下的特殊形式,并且由于梯度消失的问题,现在一般逐渐选择softmax函数至少作为输出层的激活函数使用。

以下为单分类与多分类的情况对比,激活函数分别使用sigmoid和softmax。

单分类问题中使用的sigmoid函数,就是把t2=1为常量,形式上与softmax保持一致。从损失函数等式上看二者基本上一样,但是二者本质上是不一样的,第一个是0/1问题,不同的输入对应着y1的大小发生变化,而第二个是多分类问题,不同的输入对应的是y1和y2一起产生变化。

数值上相同,但对应不同的问题模型。

标签:

x 广告
北京2023年普通本科录取控制分数线为448分|焦点速看

北京2023年普通本科录取控制分数线为448分

2023江阴中考成绩查询时间及入口

中考成绩预计将在6月28日公布,届时,考生可通过微信预约推送、最江阴A

焦点速讯:蚂蚁庄园6月26日:以下哪个是扇子在古代的别称

2023年6月26日的蚂蚁庄园小课堂其中一个问题是:以下哪个是扇子在古代

炒豆干的家常做法? 焦点消息

食材:香干9块;芹菜3根;红辣椒1个;蒜4粒;蚝油、盐、生抽、蒸鱼豉油

全球快讯:售价不到600元!诺基亚神机增加紫色款式

据删除的诺基亚印度帖文透露,诺基亚C12Pro手机将推出紫色款式。该款手

山东 | “数字+”,让生活更智慧更美好

“打开‘慧停车’手机应用,很快查到附近哪儿有空余车位,停车再也不用

【播资讯】微视频|大地诗篇

土地,是万物之源、立国之本,是“大国粮仓”的根基。6月25日是第33个

高质量发展看中国|“湘”村振兴:一只小兔子“蹦”出三亿元大产业-环球速递

央广网永州6月24日消息(记者唐丽丽 通讯员郑明辉)一年可以出笼多少

23165期福彩体彩晒票,找不到路不等于没有路_环球快播报

在人生崎岖漫长的道路上,我们定会遇到各式各样的困难和挑战,有时候我

亚马逊云科技投资一亿美元成立生成式AI创新中心

中关村在线消息,亚马逊云科技近日宣布成立亚马逊云科技生成式AI创新中

x 广告

Copyright ©  2015-2023 亚洲都市网版权所有  备案号:京ICP备2021034106号-51   联系邮箱:5 516 538 @qq.com