什麼叫線性可分和線性不可分,例如一個數據,只要數據畫出散點,就是在坐標軸上畫了很多點,兩類事物,只要有不同,通過數據分類,那麼他們的這些點一定有個邊界,那麼就可以畫出一條線把他們分開,這就是線性可分。但如果是一幅圖,例如一只貓,你判斷它是狗還是貓,你需要找特征,但它有各種姿勢,也就是數據不全,本來就沒辦法數字化,例如什麼是耳朵,什麼是鼻子,眼楮看都得勁,別說數字化了,貓還分很多種,耳朵有大小,有的還擋住了,那沒有看到耳朵,是不是就不是貓,這就很難講了,所以根本無法在一幅圖里找出所有特征,為就是無法完全數字化,也就更難用比對的方法畫出各種特征點,其實現實世界都是這樣,我們人可能根據一個爪子就可以猜到是個貓或狗,當然他肯定不是馬的蹄子,所謂人也是靠猜,不可能拿到所有數據,也就是說人也是靠概率。那麼人工智能也可以這麼干。就是百分之八十是貓,百分之10是狗,還有百分之是不知道是不是猴子,所以就猜是貓。我覺得就是反復推敲,去除不必要的特征數據,例如長了個肉球,沒了個眼楮。在數據不全的情況下,如果我們提取了大量的貓的圖片,掌握了大量的特征,那麼就可以猜了。總比不知道好,我覺得這就是非線性,解決線性不可分問題,哈哈。
好,那我用一個童話故事,把“線性可分”和“線性不可分”講得更形象。
?
童話故事森林里的分界線
很久很久以前,在一片大森林里,住著兩群小動物
? 一群是 小老鼠家族,它們喜歡在森林的左邊活動。
? 一群是 小松鼠家族,它們喜歡在森林的右邊活動。
每天,老獵人都會從高高的山上往下看,他發現
啊,原來只要在森林中間畫一條直線,左邊全是老鼠,右邊全是松鼠!
這樣一來,哪怕老獵人只看到動物的一點點影子,也能憑那條直線猜出是老鼠還是松鼠。
這就是 線性可分 ——用一條線就能把兩類小動物分開。
?
可是,森林越來越熱鬧了,來了兩種新的小動物
? 小兔子有的喜歡跟老鼠混在一起,有的卻愛跑到松鼠那邊找堅果。
? 小狐狸有時躲在老鼠堆里,有時又跑去松鼠窩偷吃。
這下子,老獵人可犯難了
“天啊!這下不行了,我怎麼畫直線都畫不出來呀!老鼠和松鼠之間摻雜了兔子和狐狸,根本分不開嘛!”
這就是 線性不可分 ——無論怎麼畫直線,都沒法把不同動物分清楚。
?
魔法師的辦法
森林里住著一位聰明的魔法師,他說
1 增加維度
魔法師揮一揮手,把森林從“平面”變成了“立體迷宮”。
原本糾纏在一起的老鼠、松鼠、兔子、狐狸,突然在高維空間里站開了距離。
魔法師輕輕一劃,就能分開。
(這就是 核方法,把數據映射到更高維度來解決問題)
2 非線性邊界
魔法師沒有畫直線,而是用森林里的大樹拼成一條彎彎曲曲的籬笆牆。
這樣,老鼠在籬笆這邊,松鼠在那邊,兔子和狐狸也能被慢慢分開。
(這就是 神經網絡,用很多“彎彎曲曲”的函數去逼近復雜邊界)
3 概率猜測
魔法師說
“有時候我也不能完全確定,但我能說
80 是老鼠,15 是兔子,5 是狐狸。”
雖然不是絕對正確,但猜測已經足夠聰明了。
(這就是 概率分類,ai 像人一樣“八九不離十”地判斷)
?
故事寓意
? 當森林里的動物分得很清楚,就像老鼠和松鼠,畫一條直線就能解決,這就是線性可分。
? 當森林里的動物混在一起,就像兔子和狐狸攪局,怎麼畫直線都不行,這就是線性不可分。
? 魔法師的“魔法”就是現代人工智能的辦法
? 升維(核方法)
? 彎曲的邊界(神經網絡)
? 概率判斷(貝葉斯思維)
所以,ai 就像森林里的魔法師,幫我們在人類看不清的混亂世界里,畫出新的“分界線”。
?
你這個思路很棒,已經把“線性可分”和“線性不可分”的核心意思抓住了,而且還自然地聯系到了圖像識別和人類認知的概率性。讓我幫你再系統梳理一下,把概念、例子和人工智能的聯系講清楚。
?
一、什麼叫 線性可分
? 數學定義
如果有兩類數據點(比如正類和負類),能用一條直線(二維)、一個平面(三維)、或者更高維空間的一個超平面,把兩類數據完全分開,那麼就是線性可分。
換句話說存在一個邊界函數 tx+b0,使得所有正類點在一邊,負類點在另一邊。
本小章還未完,請點擊下一頁後面精彩內容!
? 直觀例子
? 想象在二維坐標平面上,有一堆紅點在左邊,一堆藍點在右邊,一條直線就能分開,這就是線性可分。
? 經典的“與門(and)”“或門(or)”問題,在邏輯上就是線性可分的。
?
二、什麼叫 線性不可分
? 數學定義
如果無論怎麼畫一條直線(或超平面),都沒法把兩類點完全分開,那就是線性不可分。
? 直觀例子
? 異或門(xor)問題
數據點是 0,0、1,1 屬于一類;0,1、1,0 屬于另一類。怎麼畫直線都分不開,必須用非線性方法。
? 圖像識別比如貓和狗的圖片,耳朵、眼楮、身體姿勢、光照條件、毛色都可能變化,導致“特征點”分布非常復雜,根本畫不出一條直線來分開。
?
三、為什麼現實世界常常是“線性不可分”
你說的很對——世界數據本來就不完美、不完整。
? 圖像識別中貓的耳朵可能被擋住、眼楮可能閉著、身體可能是趴著或卷起來的;即使是人眼,有時也得猜。
? 經濟學中市場漲跌也不是一條直線能解釋的,受無數變量影響。
? 人類判斷我們看到一個爪子就能猜出“八成是貓”,但絕不是 100 確定。
這說明我們並不總是依賴絕對邊界,而是依賴概率和特征組合來做判斷。
?
四、人工智能如何解決線性不可分問題
這就是非線性方法的意義。
1 增加維度(核方法)
? 比如支持向量機(sv),用核函數把原來二維的不可分點映射到更高維度,在高維空間里也許就能用一個超平面分開。
? 類似于你把一團打結的線拉到三維空間,就能解開一樣。
2 神經網絡(非線性激活函數)
? 多層感知機(oid),就能逼近任意復雜的函數。
? 本質上就是“組合很多小的線性片段”,拼湊出一個能分開的邊界。
3 概率分類
? 正如你說的,ai 也不會說“這是 100 的貓”,而是說“80 貓,10 狗,10 其他”。
? 這就是貝葉斯概率思維在不完備數據下,盡量給出最合理的推測。
?
五、總結(結合你的比喻)
? 線性可分就是“有一條直線能把貓和狗分開”。
? 線性不可分現實世界里,貓的姿勢、毛色、被擋住的耳朵,導致畫不出直線。
? 解決辦法
? 提取更多特征,映射到更高維度。
? 用非線性模型(神經網絡)拼湊復雜邊界。
? 用概率方法接受“不完美數據”,做最優猜測。
其實人腦和人工智能做的事很像
人靠直覺和概率猜測,ai靠模型和概率推理。
區別只是,ai需要大量數據來學會“怎麼猜”,而人類憑借進化和經驗,本能就會用“一只爪子”來做判斷。
喜歡職場小聰明請大家收藏101novel.com職場小聰明101novel.com更新速度全網最快。