大模型能成為手機廠商的救命稻草嗎?

全文4498字,約8分鐘

00:00 / 12:59

2023.09.22 17:36

 · 來自江蘇

 · 20.5萬閱讀

大模型上機,是噱頭還是科技變革?

圖片來源@視覺中國

文 | 硅基研究室,作者 | 白嘉嘉

把大模型裝進手機,成為了今年手機廠商最愛講的故事。

華為、小米、OPPO、vivo、蘋果都寫起了大模型「上機」的同題作文。其中率先落地的華為智能助手小藝,無需用戶準確說出功能名,憑直覺表達需求,小藝就能理解並執行。部分行業人士認為,手機市場格局會被重構,能夠更成熟應用大模型的品牌將會佔據上風。 

但同時,市場上也存在許多質疑的聲音,認為這不過是一種營銷概念,將基於AI芯片的終端運算偷換成了大模型的熱點概念。另一部分人則斷言,當下的手機硬件,根本不可能在保證電池壽命、手機續航的前提下運行大模型。 

手機大模型,究竟是噱頭還是科技變革? 

雖然都是大模型「上機」的同題作文,但手機廠商們還是寫出了不同的風格,其中最大的差異,是將雲端大模型接入手機,還是將大模型部署在手機端。

從進度來看,華為毫無疑問是跑得最快的那個。 

從8月初華為發布鴻蒙4.0,首次公開透露將得到大模型加持,到8月末得到盤古大模型加持智能助手小藝開啟眾測招募,再到9月15日悄悄上線Mate 60系列手機,接入了盤古人工智能大模型。一個多月時間,華為就兌現了承諾。 

據報道,小藝背後的大模型是在華為盤古L0基座大模型的基礎上,針對終端消費者場景構建了大量的場景數據與精調模型后的L1層對話模型。

基於盤古的自然語言大模型、視覺大模型以及多模態大模型,小藝在交互、生產力提升和個性化服務三個方向上增強,並實現了接口調用與用戶意圖的匹配。

什麼叫接口調用與用戶意圖的匹配? 

打個比方,你要讓秘書幫你拿一份文件。過去的人工智能你得告訴它文件放在哪個房間的哪個柜子的哪個抽屜里,而現在你只需要告訴它需要拿哪份文件就可以。 

也就是說,用戶無需準確說出功能名,憑直覺表達需求,小藝就能理解並啟用相應的功能。 

技術路線上,華為的大模型上機有兩個點比較值得留意。

值得留意的第一點是,據市場消息,小藝的語言能力是基於自然語言處理(NLP),而非大語言模型(LLM)。 

NLP和LLM是互相關聯的兩個概念,按學術上的定義,LLM是NLP的一個分支,它們的目標都是讓計算機理解和處理人類語言。 

之所以說這一點值得留意,主要是因為華為本身並不僅僅是一家手機廠商,而是一家跨通信、手機、企業服務多領域的綜合性企業。這種綜合性意味着華為對基礎大模型的迭代有更強的需求,因為基礎大模型的能力越突出,精調出符合要求的行業、垂類大模型的成本就越低,子類大模型的性能也越好。 

某種程度上,將大模型接入手機端,只是華為用「大模型賦能千行百業」過程中一個相對特殊的側面,真正決定未來企業前路的,仍是背後的基礎大模型。

從這個角度來看,和華為站在同一維度展開競爭的,其實是谷歌。

今年5月的Google I/O開發者大會上,谷歌發布了Pixel手機。作為最大的雲服務商之一,谷歌在人工智能領域也有着豐富的積累,已經推出了Bard插件,日前宣布正式接入Gmail、Docs、谷歌地圖、YouTube等應用,多模態大模型Gemini正在醞釀當中。 

國內的雲服務廠商中,百度也朝手機領域拋出了探測器,於今年5月推出了小度青禾學習手機,搭載文心大模型。 

華為值得留意的第二點,也是以上這些玩家的共通點,均是「接入」了大模型,而並非在手機端獨立運行。

其實,部署在雲端還是在終端,一直是大模型上機過程中的一個有爭議的部分,兩種方式各有優劣。 

雲端的缺點顯而易見,大模型上機是需要互聯網作為支撐的,一旦斷網就會變回原先的「人工智障」。而終端部署的後果是,大模型運算需要更高端的硬件作為支撐,手機價格水漲船高。 

不過對小米來說,終端部署大模型所帶來的硬件成本上升,恰好能為高端化戰略提供支撐。 

今年8月14日,雷軍在年度演講中透露,小米最新一個13億參數大模型已經成功在手機本地跑通,部分場景可以媲美60億參數模型在雲端的運行結果。從名稱推斷,小米MiLM-1.3B是大語言模型(LLM)。 

雖然小米並非雲服務商,但雷軍的野心顯然也不僅限於手機。儘管沒有完全透露他的答案,不過,小米月活用戶數超過1.1億的語音體系小愛同學大概率會是小米未來的主陣地之一。雷軍表示,目前已經升級小愛同學的大模型版本,正開啟邀請測試。 

而這揭露出了雷軍選擇終端部署的另一個原因。對手機來說,聯網是硬需求。但對智能音箱等小米生態產品來說,如果能在斷網的情況下實現高質量對話等功能,就能與同類產品拉開差距。 

除此之外,OPPO、vivo、蘋果也披露了研發大模型的進度,但最終成果如何,還需日後驗證。 

這兩年,大多數手機廠商都在思考同一個問題,怎麼說服消費者換手機? 

發展至今,手機已經在之前的技術框架下基本被開發到了極致,再怎麼卷硬件,也很難讓消費者眼前一亮,更別提萌生換手機的念頭了。 

請問
台中電動車哪裡在賣比較便宜可以到台中景泰電動車門市去看看總店:臺中市潭子區潭秀里雅潭路一段102-1號。
電動車補助推薦評價好的
iphone維修中心擁有專業的維修技術團隊,同時聘請資深iphone手機維修專家,現場說明手機問題,快速修理,沒修好不收錢住家的頂樓裝
太陽光電聽說可發揮隔熱功效一線推薦東陽能源擁有核心技術、產品研發、系統規劃設置、專業團隊的太陽能發電廠商。
網頁設計一頭霧水該從何著手呢?
回頭車貨運收費標準宇安交通關係企業,自成立迄今,即秉持著「以誠待人」、「以實處事」的企業信念
台中搬家公司教你幾個打包小技巧,輕鬆整理裝箱!還在煩惱搬家費用要多少哪?台中大展搬家線上試算搬家費用,從此不再擔心「物品怎麼計費」、「多少車才能裝完」
台中搬家公司費用怎麼算?擁有20年純熟搬遷經驗,提供免費估價且流程透明更是5星評價的搬家公司好山好水
露營車漫遊體驗露營車x公路旅行的十一個出遊特色。走到哪、玩到哪,彈性的出遊方案,行程跟出發地也可客製Google地圖已可更新顯示
潭子電動車充電站設置地點!!廣告預算用在刀口上,
台北網頁設計公司幫您達到更多曝光效益

Counterpoint公布的數據显示,2023年第二季度,全球智能手機銷量同比下降8%,環比下降5%。這已經是全球智能手機市場連續第八個季度處於下滑通道。 

而橫空出世的大模型,毫無疑問是今年甚至未來相當長的一段時間內最新鮮的科技故事。 

雖然手機市場上還未顯露出端倪,但大模型對終端產品的銷量帶動作用已經得到了驗證。科大訊飛CEO劉慶峰透露,接入星火大模型后,訊飛學習機5、6月份銷量均實現三位數增長。 

在手機廠商看來,這無異是一根救命稻草。

全聯併購公會信用管理委員會專家安光勇認為,手機裝入大模型是為了追趕新的潮流、彌補手機市場缺陷,手機市場目前已相對穩定,消費者對於傳統的手機參數和產品形態已經有了一定的“飽和感”。大模型的出現為手機廠商提供了一種全新的賣點和市場差異化策略。 

對銷量的帶動作用值得期待,但大模型引起的變化遠不止已於此,甚至有部分業內人士認為,手機市場的格局將會被大模型重構。 

大模型真的能有這麼大的威力嗎? 

至少從以下兩個方面來看,是的。 

首先,大模型上機看似是技術門檻,實際是對企業判斷、決策能力的考驗。

手機廠商在大模型上的博弈,並不只是簡單的組裝,背後是對廠商技術及軟件等多能力的考驗。底層系統上的融合,算法的分配和優化,功耗的控制,對“智能”的理解差異,這些都會讓廠商在體驗上拉開差距。 

比如,第一部分提到的大模型廠商在「雲端接入」和「終端部署」之間的分歧,本質上就是對功耗的控制上的分歧。 

雖然運行在手機端的大模型參數量並不像雲端大模型那樣來到千億數量級,但對手機硬件來說仍是不小的負擔,可能導致手機發燙、電池壽命縮短、續航能力下降。 

其次,大模型越用越「貼心」的屬性可能會改變大眾在選購手機及相關智能終端時的消費心理,繼而帶來更高的品牌忠誠度。

眾所周知,大模型的質量與數據、訓練量高度相關。這也意味着,一旦購入某個品牌搭載了大模型的手機后,每次呼喚大模型並要求他執行指令,都可以視為完成了一次訓練,機主和手機之間會越來越「默契」。 

因此,未來當消費者更換手機或購買新的智能產品時,可能會面臨一個新選擇:選擇和一個新的「人工智能」重新開始,還是數據、模型互通的同品牌手機繼續使用? 

對手機廠商來說,大模型是一道必選題,不論最後能獲得怎樣的分數,放棄作答肯定都不是明智之選。 

但站在消費者的立場上,大模型「上機」,仍有許多疑慮有待解答。 

第一個問題在前文其實已經鋪墊了許多,比如大模型上機帶來的硬件負擔,模型參數較小,雲端和終端的分歧,這些內容傳遞出的信息是,至少在設備層面上,大模型上機仍不成熟。 

那麼,大模型上機究竟是不是噱頭?

客觀來說,這個問題的答案取決於我們如何定義噱頭。 

如果將標準定在手機能不能運行大模型,其實,早在今年5月,大模型就已經在手機上跑起來過了。 

彼時,科技圈大佬陳天奇和他帶領的CMU機器學習編譯小組(MLC),開源發布了一個叫MLC-LLM的通用解決方案。通過這個方案,任何語言模型都被允許部署在各種硬件後端和本機應用程序上,併為每個人提供一個高效的框架,以進一步優化自己用例的模型性能。 

方案發布后,極客們紛紛跟進,並在社交平台上曬出了在「飛行模式」下運行大模型的效果,收穫了一片「Amazing~」。 

陳天奇和極客們與各大手機廠商無利益相關,他們的實際體驗證明,手機芯片足以支撐大模型的運轉。

但如果將標準提高一些,以能否成為一個輔助工作的智能助手來衡量大模型「上機」,答案可能是令人失望的。

本輪大模型熱的技術原點,是OpenAI將模型參數提升到了千億級別後,出現了許多意想不到的能力,但這種規模的大模型運轉的成本非常高,遠非手機所能支撐。 

因此,想將大模型裝進手機,需要通過剪枝、蒸餾、量化等手段縮小模型規模。這也意味着,手機端大模型不可能像ChatGPT或文心一言等雲端大模型那麼智能,能力範圍大幅縮窄。

從這個角度來看,「雲端接入」或許是「水分」更少的做法。 

不過,即便採用雲端接入的做法,可能也很難做到令消費者滿意的程度。 

目前的大模型研究仍未解決的一個關鍵問題是「幻覺」,簡單來說,「幻覺」的存在會讓大模型一本正經的胡說八道。 許多Chatbot的使用者都曾被它誠懇的語句所迷惑,導致輕信了它漏洞百出的答案。 

這種隱蔽的錯誤是工作中的定時炸彈。試想,你要求大模型幫你搜集整理資料,並用它憑空捏造的結論來推進事務,會產生多麼嚴重的後果。 

此外,「雲端接入」給消費者帶來的另一個問題是信息安全。 

24小時手機不離身是當代人的常態,它深度參与我們的工作與生活。因此,當它具備一定程度的智能,有權限調取我們的信息並反饋至雲端進行演算后,信息泄露的風險也隨之而來。

這並非是杞人憂天。今年4月,三星就因為啟用ChatGPT在20天內出現3起數據泄漏事故,導致其與半導體設備測量、良品率/缺陷、內部會議內容等關鍵信息被上傳到ChatGPT的服務器中。 

而這也是小米選擇通過終端部署的方式實現大模型上機的原因,雖然硬件上困難重重,但僅在本地運行的模式,卻能在最大程度上解決信息泄露的問題。 

整體來說,手機廠商的大模型上機不是空頭支票,但也沒有他們所描繪的那麼美好。將大模型看作殺手鐧,既高估了大模型的能力,也低估了真正落地用戶端所面臨的難題。 

https://www.tmtpost.com/6719047.html