目錄
職場小聰明
書籍

第583章 啟用函數

職場小聰明 · 翟曉鷹

啟用函數是什麼?——用故事和比喻講解

故事比喻:門衛老張的篩選機製

想象一個大型科技公司的總部大樓,每天有很多人想進公司。但並不是所有人都能進去,隻有符合某些條件的員工才能進入工作,而其他人要被攔在門外。

這座大樓的門口站著一個門衛——老張。他的任務是檢查進來的人,決定誰能進,誰不能進。他的決策規則就像神經網絡中的“啟用函數”!

第一種情況:老張完全放行(恒等函數)

有一天,老張心情很好,他決定:“今天所有人都能進!”

?不管是正式員工、遊客,還是快遞小哥,隻要有人過來,老張就讓他們進大樓。

?這就像是**“線性函數”或“恒等函數”**(IdentityFunction),冇有任何篩選,數據怎麼進來,就怎麼傳遞出去。

問題:

?如果門口有太多人,會導致辦公樓人滿為患,甚至乾擾員工工作(資訊過載)。

?這種情況下,神經網絡可能無法學習複雜的特征,因為它冇有任何“過濾”或“啟用”機製。

第二種情況:老張隻讓合格員工進(ReLU啟用函數)

第二天,公司老闆告訴老張:“從現在開始,隻有正式員工能進,其他人一律不準進!”

?於是,如果有人出示正式員工證,老張就讓他進去。

?但如果是遊客、閒雜人等,老張直接搖頭:“不行,回去吧!”

這就像ReLU(修正線性單元)啟用函數:

?如果輸入是正數(正式員工),就直接通過,傳遞給下一層神經網絡。

?如果輸入是負數(閒雜人等),直接變成0,相當於拒絕進入。

優點:

?過濾掉無用資訊(負數變成0,相當於遮蔽了一些乾擾)。

?計算簡單,速度快,不會引入複雜的計算。

問題:

?萬一是一個優秀但冇證件的實習生呢?他可能也被老張攔在門外了(ReLU會把所有負數資訊直接清零)。

第三種情況:老張有點猶豫(Sigmoid啟用函數)

有一天,老張覺得:“或許我不該這麼絕對,可能有些遊客也是未來的潛在客戶,不該完全拒之門外。”

於是,他製定了一套打分係統:

?正式員工(高分):直接進!

?遊客(中等分):可以進去看看,但不能隨意走動。

?陌生人(低分):抱歉,不能進!

這就像Sigmoid啟用函數,它的輸出介於0到1之間,相當於一種概率衡量:

?高於0.5的人(高分):大概率被接受。

?低於0.5的人(低分):大概率被拒絕。

優點:

?可以平滑地過濾數據,避免“全進或全不進”這樣極端的情況。

?適用於二分類問題(比如郵件是垃圾郵件還是正常郵件)。

問題:

?計算比較複雜,不像ReLU那麼直接。

?當數據過大或過小時,變化很小,容易導致梯度消失(學習速度變慢)。

第四種情況:老張更加智慧(Softmax啟用函數)

有一天,老闆告訴老張:“我們公司不僅有正式員工,還有不同的部門,比如工程部、市場部、財務部。你不能隻區分‘進’或‘不進’,而是要把人分到不同的部門。”

於是,老張開發了一套更加高級的評分係統,不僅判斷某人是否能進,還會計算他屬於哪個部門的概率。

?如果一個人穿著工程師製服,90%可能屬於工程部,10%可能屬於市場部。

?如果一個人拿著營銷資料,80%可能屬於市場部,20%可能屬於工程部。

?每個人都按照最高概率歸類到相應部門。

這就像Softmax啟用函數,它的作用是:

?把所有的可能性轉換成概率分佈(所有概率加起來是1)。

?適用於多分類問題(比如識彆一張圖片是“貓”、“狗”還是“兔子”)。

優點:

?適合多類彆分類,可以告訴你**“最有可能”是哪一類**。

問題:

?計算量比ReLU大一點,但在分類任務中是最合適的。

總結:不同啟用函數的角色

啟用函數比喻適用場景優點問題

恒等函數(Identity)老張不篩選,所有人都能進線性迴歸簡單直接不能處理複雜問題

ReLU老張隻讓正式員工進,其他人全拒深度學習、CNN計算簡單,效率高負數全部變0,資訊可能丟失

Sigmoid老張給每個人打分,決定能不能進二分類問題(垃圾郵件分類)平滑過渡,輸出0-1概率容易梯度消失

Softmax老張不但決定誰進,還要分部門多分類問題(圖像識彆)適合多分類問題計算比ReLU複雜

結論:啟用函數=智慧篩選機製

?啟用函數的作用就像門衛老張,決定哪些資訊能進入下一層,哪些要被拒絕。

?不同的啟用函數適用於不同的任務,ReLU、Sigmoid、Softmax各有千秋。

?深度學習的關鍵就是如何聰明地使用這些篩選機製,讓神經網絡學得更快、更準確!

你更喜歡哪個“門衛策略”呢?如果你是老張,你會怎麼設計你的篩選規則?

若章節內容顯示異常,請重新整理或切換到 手機版 / 電腦版 檢視。