職場小聰明

第915章 什麼叫線性可分和線性不可分

類別︰都市言情 作者︰翟曉鷹 本章︰第915章 什麼叫線性可分和線性不可分

    什麼叫線性可分和線性不可分,例如一個數據,只要數據畫出散點,就是在坐標軸上畫了很多點,兩類事物,只要有不同,通過數據分類,那麼他們的這些點一定有個邊界,那麼就可以畫出一條線把他們分開,這就是線性可分。但如果是一幅圖,例如一只貓,你判斷它是狗還是貓,你需要找特征,但它有各種姿勢,也就是數據不全,本來就沒辦法數字化,例如什麼是耳朵,什麼是鼻子,眼楮看都得勁,別說數字化了,貓還分很多種,耳朵有大小,有的還擋住了,那沒有看到耳朵,是不是就不是貓,這就很難講了,所以根本無法在一幅圖里找出所有特征,為就是無法完全數字化,也就更難用比對的方法畫出各種特征點,其實現實世界都是這樣,我們人可能根據一個爪子就可以猜到是個貓或狗,當然他肯定不是馬的蹄子,所謂人也是靠猜,不可能拿到所有數據,也就是說人也是靠概率。那麼人工智能也可以這麼干。就是百分之八十是貓,百分之10是狗,還有百分之是不知道是不是猴子,所以就猜是貓。我覺得就是反復推敲,去除不必要的特征數據,例如長了個肉球,沒了個眼楮。在數據不全的情況下,如果我們提取了大量的貓的圖片,掌握了大量的特征,那麼就可以猜了。總比不知道好,我覺得這就是非線性,解決線性不可分問題,哈哈。

    好,那我用一個童話故事,把“線性可分”和“線性不可分”講得更形象。

    ?

    童話故事森林里的分界線

    很久很久以前,在一片大森林里,住著兩群小動物

    ? 一群是 小老鼠家族,它們喜歡在森林的左邊活動。

    ? 一群是 小松鼠家族,它們喜歡在森林的右邊活動。

    每天,老獵人都會從高高的山上往下看,他發現

    啊,原來只要在森林中間畫一條直線,左邊全是老鼠,右邊全是松鼠!

    這樣一來,哪怕老獵人只看到動物的一點點影子,也能憑那條直線猜出是老鼠還是松鼠。

    這就是 線性可分 ——用一條線就能把兩類小動物分開。

    ?

    可是,森林越來越熱鬧了,來了兩種新的小動物

    ? 小兔子有的喜歡跟老鼠混在一起,有的卻愛跑到松鼠那邊找堅果。

    ? 小狐狸有時躲在老鼠堆里,有時又跑去松鼠窩偷吃。

    這下子,老獵人可犯難了

    “天啊!這下不行了,我怎麼畫直線都畫不出來呀!老鼠和松鼠之間摻雜了兔子和狐狸,根本分不開嘛!”

    這就是 線性不可分 ——無論怎麼畫直線,都沒法把不同動物分清楚。

    ?

    魔法師的辦法

    森林里住著一位聰明的魔法師,他說

    1 增加維度

    魔法師揮一揮手,把森林從“平面”變成了“立體迷宮”。

    原本糾纏在一起的老鼠、松鼠、兔子、狐狸,突然在高維空間里站開了距離。

    魔法師輕輕一劃,就能分開。

    (這就是 核方法,把數據映射到更高維度來解決問題)

    2 非線性邊界

    魔法師沒有畫直線,而是用森林里的大樹拼成一條彎彎曲曲的籬笆牆。

    這樣,老鼠在籬笆這邊,松鼠在那邊,兔子和狐狸也能被慢慢分開。

    (這就是 神經網絡,用很多“彎彎曲曲”的函數去逼近復雜邊界)

    3 概率猜測

    魔法師說

    “有時候我也不能完全確定,但我能說

    80 是老鼠,15 是兔子,5 是狐狸。”

    雖然不是絕對正確,但猜測已經足夠聰明了。

    (這就是 概率分類,ai 像人一樣“八九不離十”地判斷)

    ?

    故事寓意

    ? 當森林里的動物分得很清楚,就像老鼠和松鼠,畫一條直線就能解決,這就是線性可分。

    ? 當森林里的動物混在一起,就像兔子和狐狸攪局,怎麼畫直線都不行,這就是線性不可分。

    ? 魔法師的“魔法”就是現代人工智能的辦法

    ? 升維(核方法)

    ? 彎曲的邊界(神經網絡)

    ? 概率判斷(貝葉斯思維)

    所以,ai 就像森林里的魔法師,幫我們在人類看不清的混亂世界里,畫出新的“分界線”。

    ?

    你這個思路很棒,已經把“線性可分”和“線性不可分”的核心意思抓住了,而且還自然地聯系到了圖像識別和人類認知的概率性。讓我幫你再系統梳理一下,把概念、例子和人工智能的聯系講清楚。

    ?

    一、什麼叫 線性可分

    ? 數學定義

    如果有兩類數據點(比如正類和負類),能用一條直線(二維)、一個平面(三維)、或者更高維空間的一個超平面,把兩類數據完全分開,那麼就是線性可分。

    換句話說存在一個邊界函數 tx+b0,使得所有正類點在一邊,負類點在另一邊。

    本小章還未完,請點擊下一頁後面精彩內容!

    ? 直觀例子

    ? 想象在二維坐標平面上,有一堆紅點在左邊,一堆藍點在右邊,一條直線就能分開,這就是線性可分。

    ? 經典的“與門(and)”“或門(or)”問題,在邏輯上就是線性可分的。

    ?

    二、什麼叫 線性不可分

    ? 數學定義

    如果無論怎麼畫一條直線(或超平面),都沒法把兩類點完全分開,那就是線性不可分。

    ? 直觀例子

    ? 異或門(xor)問題

    數據點是 0,0、1,1 屬于一類;0,1、1,0 屬于另一類。怎麼畫直線都分不開,必須用非線性方法。

    ? 圖像識別比如貓和狗的圖片,耳朵、眼楮、身體姿勢、光照條件、毛色都可能變化,導致“特征點”分布非常復雜,根本畫不出一條直線來分開。

    ?

    三、為什麼現實世界常常是“線性不可分”

    你說的很對——世界數據本來就不完美、不完整。

    ? 圖像識別中貓的耳朵可能被擋住、眼楮可能閉著、身體可能是趴著或卷起來的;即使是人眼,有時也得猜。

    ? 經濟學中市場漲跌也不是一條直線能解釋的,受無數變量影響。

    ? 人類判斷我們看到一個爪子就能猜出“八成是貓”,但絕不是 100 確定。

    這說明我們並不總是依賴絕對邊界,而是依賴概率和特征組合來做判斷。

    ?

    四、人工智能如何解決線性不可分問題

    這就是非線性方法的意義。

    1 增加維度(核方法)

    ? 比如支持向量機(sv),用核函數把原來二維的不可分點映射到更高維度,在高維空間里也許就能用一個超平面分開。

    ? 類似于你把一團打結的線拉到三維空間,就能解開一樣。

    2 神經網絡(非線性激活函數)

    ? 多層感知機(oid),就能逼近任意復雜的函數。

    ? 本質上就是“組合很多小的線性片段”,拼湊出一個能分開的邊界。

    3 概率分類

    ? 正如你說的,ai 也不會說“這是 100 的貓”,而是說“80 貓,10 狗,10 其他”。

    ? 這就是貝葉斯概率思維在不完備數據下,盡量給出最合理的推測。

    ?

    五、總結(結合你的比喻)

    ? 線性可分就是“有一條直線能把貓和狗分開”。

    ? 線性不可分現實世界里,貓的姿勢、毛色、被擋住的耳朵,導致畫不出直線。

    ? 解決辦法

    ? 提取更多特征,映射到更高維度。

    ? 用非線性模型(神經網絡)拼湊復雜邊界。

    ? 用概率方法接受“不完美數據”,做最優猜測。

    其實人腦和人工智能做的事很像

    人靠直覺和概率猜測,ai靠模型和概率推理。

    區別只是,ai需要大量數據來學會“怎麼猜”,而人類憑借進化和經驗,本能就會用“一只爪子”來做判斷。

    喜歡職場小聰明請大家收藏101novel.com職場小聰明101novel.com更新速度全網最快。

加入書簽 上一章 目 錄 下一章 加入書架 推薦本書

如果您喜歡,請把《職場小聰明》,方便以後閱讀職場小聰明第915章 什麼叫線性可分和線性不可分後的更新連載!
如果你對職場小聰明第915章 什麼叫線性可分和線性不可分並對職場小聰明章節有什麼建議或者評論,請後台發信息給管理員。