Copyright ? 2021-2021 武漢洪山科創(chuàng)產(chǎn)業(yè)發(fā)展有限公司 All Rights Reserved. 備案號:鄂ICP備2022000812號-1
摘要
近期OpenAI、微軟和百度競相發(fā)布大模型產(chǎn)品,帶給人們實實在在的震撼體驗。MaaS(Model as a Service)模型即服務(wù)以其通用性、自監(jiān)督學(xué)習(xí)能力和強大的智能能力助力AI產(chǎn)業(yè)化進程,降低AI落地應(yīng)用的門檻。國內(nèi)外AI領(lǐng)域企業(yè)競相研發(fā)有競爭力的大模型產(chǎn)品,大模型領(lǐng)域已初步形成生態(tài)規(guī)模。未來,大模型在應(yīng)用端、中間服務(wù)端以及底層服務(wù)端發(fā)展?jié)摿薮蟆?/span>
從OpenAI發(fā)布GPT-4,到百度發(fā)布文心一言,再到微軟發(fā)布Office的AI生產(chǎn)力工具Microsoft 365 Copilot,各大廠紛紛重金布局既是前瞻性的戰(zhàn)略舉措,也是資本和技術(shù)的完美展示。據(jù)報道,GPT-3訓(xùn)練一次的成本約為140萬美元,2022年,OpenAI公司凈虧損5.45億美元,成立七年累計凈投入近40億美元。人們不禁要問,是不是只有大廠才有資格參與人工智能這場盛宴?AI是否只掌握在少數(shù)大廠的算法人員手中,難以走向大眾化?模型即服務(wù)(MaaS)作為一種新的商業(yè)模式,有望打破局限,即便是非互聯(lián)網(wǎng)行業(yè)小公司,也可能通過MaaS模式,打造出一款專業(yè)領(lǐng)域的爆款應(yīng)用軟件。
一、何為MaaS
在云計算時代,我們已經(jīng)熟悉的是IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺即服務(wù))和SaaS(軟件即服務(wù)),而MaaS 作為AI領(lǐng)域一種全新的商業(yè)模式,正如李彥宏所說,過去云服務(wù)看算力、存儲等基礎(chǔ),未來則更多會看框架與模型,MaaS將會改變云計算的游戲規(guī)則。
大模型是“大算力+強算法”結(jié)合的產(chǎn)物,通常是在海量公開的無標(biāo)注數(shù)據(jù)上進行訓(xùn)練,學(xué)習(xí)出一種特征和規(guī)則,應(yīng)用開發(fā)時通過目標(biāo)任務(wù)場景中的小數(shù)據(jù)集進行微調(diào),使模型達(dá)到需要的性能,就可以完成多個應(yīng)用場景的任務(wù)。在這一過程中,這種在公開數(shù)據(jù)集訓(xùn)練過的深層網(wǎng)絡(luò)模型,即為“預(yù)訓(xùn)練模型”,預(yù)訓(xùn)練能夠大大降低下游任務(wù)模型對標(biāo)注數(shù)據(jù)規(guī)模的要求,從而可以很好的處理一些難以獲得大量標(biāo)注數(shù)據(jù)的新場景。
簡單來說,MaaS模式下,通常是科技巨頭開發(fā)出一套AI模型作為一個通用的底板,正如一個“通識型人才”,通過對外開放這些AI模型的調(diào)用接口吸引規(guī)模較小、但是深耕行業(yè)的玩家,由細(xì)分領(lǐng)域的公司將模型打磨成真正滿足行業(yè)需求的應(yīng)用,也就是培養(yǎng)出“專業(yè)人才”。
AI大模型的開發(fā)方式
參考資料:百度文心大模型官微
二、MaaS能給AI產(chǎn)業(yè)帶來什么
自人工智能誕生以來的七八十年間,帶給人們的驚嘆比比皆是,MaaS的概念之前也被提出過,但為何在今時今日火爆出圈?
從上世紀(jì)六十年代最早的智能機器人Shakey,到八十年代深藍(lán)戰(zhàn)勝國際象棋冠軍卡斯帕羅夫,再到2016年的AlphaGo戰(zhàn)勝世界圍棋冠軍等等,AI技術(shù)從來不缺讓人震撼的新聞,但真正能夠產(chǎn)業(yè)化落地的卻少之又少,過去的AI熱帶火的更多是概念和信心,但還沒有產(chǎn)生顛覆某個行業(yè)的影響。但是這一輪AI技術(shù)帶來的完全是不同的新體驗,2022年ChatGPT的出現(xiàn),讓我們所有普通人都感受到切切實實的“好用”,上線僅僅2個月后注冊用戶數(shù)就突破了1億,完全超出人們的預(yù)期,這是有可能顛覆“搜索引擎”行業(yè)的新技術(shù)。
目前,人工智能正處于產(chǎn)業(yè)化落地應(yīng)用的早期階段,努力發(fā)展 “好用”的產(chǎn)品,但面臨著人力研發(fā)成本高、特定場景數(shù)據(jù)較少導(dǎo)致模型訓(xùn)練精度不夠、模型算法產(chǎn)品化實際效果不滿足需求、場景需求碎片化等行業(yè)痛點。而大模型通過提高模型的通用性、降低研發(fā)成本等方式能夠加速AI產(chǎn)業(yè)化進程,降低AI落地應(yīng)用的門檻。
(1)大模型的通用性提升AI 開發(fā)的效率
過去近10年間,AI開發(fā)主要是通過“深度學(xué)習(xí)+大算力”從而獲得訓(xùn)練模型,但是在傳統(tǒng)模式中,AI模型基本上是針對特定應(yīng)用場景需求進行訓(xùn)練的,整個模型開發(fā)需要完成從確定場景需求、數(shù)據(jù)收集、模型設(shè)計到落地應(yīng)用等階段的整套流程,不僅耗費時間長,一個項目往往需要數(shù)月甚至數(shù)年才能完成,而且對人力素質(zhì)要求很高,需要優(yōu)秀的產(chǎn)品經(jīng)理、專業(yè)的AI 研發(fā)人員等協(xié)同合作,人力成本高昂。但是,這樣定制化的模型開發(fā)方式得到的模型在許多垂直行業(yè)場景任務(wù)下并不通用,模型無法復(fù)用和積累,導(dǎo)致了AI落地的高成本、高門檻與低效率。
而大模型通過從海量的、多類型的場景數(shù)據(jù)中學(xué)習(xí),總結(jié)學(xué)習(xí)不同場景業(yè)務(wù)下的通用特征和規(guī)則,成為具有泛化能力的模型底座,利用大模型進行新的業(yè)務(wù)場景下的應(yīng)用開發(fā)時,對大模型進行微調(diào)或者不調(diào)整,就可以完成多個應(yīng)用場景的任務(wù)。過去,云計算服務(wù)商通常會將硬件資源、通用的軟件能力、底層框架等來提供服務(wù),如今,基于大模型的通用能力可以有效應(yīng)對多樣化、碎片化的AI應(yīng)用需求,模型也上升到底層框架服務(wù)的維度,開始成為第一生產(chǎn)力。MaaS體現(xiàn)了All For everyone的概念,數(shù)據(jù)集倉庫、模型倉庫、算力平臺通過提供零門檻模型體驗、快捷的模型使用、完整鏈路的模型定制和云端模型部署向每個人開放,包括AI愛好者、使用者、開發(fā)者和研究者。
MaaS基本產(chǎn)業(yè)架構(gòu)
參考資料:阿里云棲大會
(2)大模型的自監(jiān)督學(xué)習(xí)能力降低AI開發(fā)及訓(xùn)練成本
傳統(tǒng)的模型訓(xùn)練過程中,需要不少AI專業(yè)研發(fā)人員手工來完成大量的調(diào)參、調(diào)優(yōu)工作,同時,模型訓(xùn)練需要海量的數(shù)據(jù),但是許多行業(yè)數(shù)據(jù)收集困難、標(biāo)注成本高,研發(fā)人員需要花費大量的時間精力收集整理原始數(shù)據(jù)。
相對于傳統(tǒng)AI模型開發(fā)模式,大模型的研發(fā)流程更加標(biāo)準(zhǔn)化,通用性更強,可以泛化應(yīng)用到多種行業(yè)場景中,而且,大模型的自監(jiān)督學(xué)習(xí)能力可以取代傳統(tǒng)的人工標(biāo)注數(shù)據(jù)完成模型訓(xùn)練的模式,能夠顯著降低研發(fā)成本,為解決AI落地難、促進AI產(chǎn)業(yè)化進程這一問題提供助力。
(3)大模型帶來更強大的智能能力 除了通用性和自監(jiān)督學(xué)習(xí)能力以外,大模型最突出的優(yōu)勢在于效果,其通過給模型“填喂”大數(shù)據(jù)提高其自我學(xué)習(xí)能力,進而具有更強的智能程度,所訓(xùn)練的數(shù)據(jù)規(guī)模越大,生成的模型也就越智能。OpenAI的研究表明,2012至2018年,在最大規(guī)模的人工智能模型訓(xùn)練中所使用的計算量呈現(xiàn)指數(shù)級增長,其中有3.5個月的時間計算量翻倍增長,遠(yuǎn)快于摩爾定律每18個月翻一倍的速度。據(jù)有關(guān)研究者預(yù)測,下一代AI大模型,參數(shù)的數(shù)量級將于人類大腦突觸水平比肩,并且不僅能處理語言模型這樣的單一任務(wù),更能夠處理語言、聲音、圖像等多任務(wù)的多模態(tài)AI模型。
三、MaaS 的應(yīng)用場景
在AI產(chǎn)業(yè)鏈中,大模型作為一種基礎(chǔ)設(shè)施,可以搭載各式平臺,將AI技術(shù)賦能千行百業(yè)。正如過去電力時代一樣,電力經(jīng)過生產(chǎn)和運輸運用到各類電器,如今智能通過數(shù)據(jù)訓(xùn)練和計算應(yīng)用到各類場景。相應(yīng)地,大模型公司也將成為AI領(lǐng)域中的基礎(chǔ)類公司,發(fā)揮大模型作為基礎(chǔ)設(shè)施與底座的能力,基于“大算力+強算法+大規(guī)模預(yù)訓(xùn)練+微調(diào)”的方式滿足AI產(chǎn)業(yè)鏈下游客戶的應(yīng)用需求。
大模型基礎(chǔ)設(shè)施賦能千行百業(yè)
資料來源:智源研究院
AI大模型行業(yè)適用范圍非常廣泛,在醫(yī)療、金融、交通、零售、氣象、新聞傳播、文學(xué)藝術(shù)等領(lǐng)域都有廣泛應(yīng)用場景。大模型可以抓取所需數(shù)據(jù),自主完成篩選和分析,在大模型中輸入關(guān)鍵詞、主題等設(shè)定屬性后,即可生成滿足需求條件的文本內(nèi)容,并自主撰寫生成報告,可以用于產(chǎn)品營銷文案寫作、電商智能客服等,也能輔助從業(yè)人員做決策。還有自動問診、小說續(xù)寫、電力檢測……因為懂得人類語言,且具備各種細(xì)分行業(yè)的專業(yè)知識,AI大模型具有分飾多角的能力。 2022年11月,阿里達(dá)摩院推出AI模型社區(qū)“魔搭”ModelScope,率先向魔搭社區(qū)貢獻300多個經(jīng)過驗證的優(yōu)質(zhì)AI模型,包括視覺、語音、自然語言處理、多模態(tài)等AI主要方向,踐行模型即服務(wù)的新理念,提供眾多預(yù)訓(xùn)練基礎(chǔ)模型,只需針對具體場景再稍作調(diào)優(yōu),就能快速投入使用。 2022年12月,美國谷歌利用一個已成形的基礎(chǔ)AI算法,疊加上專門基于醫(yī)療數(shù)據(jù)的訓(xùn)練流程進行微調(diào),經(jīng)過兩輪打磨之后建立了Med-PaLM的模型,未來有望助力AI問診,降低醫(yī)療服務(wù)的成本。在音樂領(lǐng)域,兩位畢業(yè)于美國普林斯頓大學(xué)的工程師利用業(yè)余時間,在一款已經(jīng)開源的AI畫圖算法的基礎(chǔ)上,微調(diào)模型,將其改造成一款叫做Riffusion的AI音樂創(chuàng)作工具。
四、國內(nèi)外大模型布局
當(dāng)前,大模型領(lǐng)域已初步形成生態(tài)規(guī)模,國內(nèi)外眾多公司和研究機構(gòu)在大模型領(lǐng)域積極布局,大模型參數(shù)規(guī)模最高已達(dá)百萬億級別,且面向多模態(tài)場景的大模型已成為未來的趨勢。
國外的超大規(guī)模預(yù)訓(xùn)練模型起步于2018 年,并在 2021 年進入白熱化階段。2017年,Vaswani等提出Transformer架構(gòu),使深度學(xué)習(xí)模型參數(shù)達(dá)到了上億的規(guī)模。2018年,谷歌提出了大規(guī)模預(yù)訓(xùn)練語言模型BERT,同年OpenAI提出了生成式預(yù)訓(xùn)練Transformer模型——GPT,使自然語言處理領(lǐng)域飛速發(fā)展。之后,OpenAI 繼續(xù)推出15億參數(shù)的GPT-2、1750 億參數(shù)的超大規(guī)模語言訓(xùn)練模型 GPT-3,通過兩年時間實現(xiàn)了模型規(guī)模從億級到上千億級的突破,實現(xiàn)作詩、聊天、生成代碼等功能。2021 年,谷歌推出首個萬億級語言模型Switch Transformer。高速發(fā)展一直持續(xù)到2022年,OpenAI 推出ChatGPT、GPT-4,震撼了幾乎整個世界。大型語言模型的參數(shù)數(shù)量保持著指數(shù)即的增長。
在國內(nèi),超大模型的發(fā)展也非常迅速,2021年是中國 AI大模型的爆發(fā)年。2021 年,商湯發(fā)布擁有 100 億的參數(shù)量的書生(INTERN)大模型,截至2021年中,商湯已建成擁有超過 300 億個參數(shù)的世界最大計算器視覺模型。同年4月,華為云聯(lián)合循環(huán)智能發(fā)布參數(shù)規(guī)模達(dá)1000 億的盤古NLP超大規(guī)模預(yù)訓(xùn)練語言模型。隨后,浪潮信息發(fā)布約2500億的超大規(guī)模預(yù)訓(xùn)練模型“源 1.0”,百度推出參數(shù)規(guī)模達(dá)2600 億的ERNIE 3.0 Titan 模型,而阿里達(dá)摩院的M6模型參數(shù)達(dá)到10萬億,將大模型參數(shù)直接提升了一個量級。2022年,清華大學(xué)、阿里達(dá)摩院等聯(lián)合研究的“腦級人工智能模型”八卦爐(BAGUALU)發(fā)布,模型參數(shù)突破了174 萬億個,完全可以與人腦中的突觸數(shù)量相媲美。
信息來源:商湯科技官微,天翼智庫、公開信息
五、發(fā)展機遇
李彥宏在文心一言發(fā)布會上預(yù)言大模型時代將產(chǎn)生三大產(chǎn)業(yè)機會,排在首位的是新型云計算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS。大模型時代的來臨催生新模式新業(yè)態(tài),AI大模型正逐步融入到生產(chǎn)生活領(lǐng)域的每一個核心場景,最大的發(fā)展機遇就是在應(yīng)用端。圍繞大模型底座進行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商,基于文本生成、圖像生成、音視頻生成等場景,開發(fā)金融大模型、醫(yī)療大模型、交通大模型、能源大模型等一系列應(yīng)用大模型,將技術(shù)平臺與產(chǎn)業(yè)深度融合,完全有可能成為未來的獨角獸企業(yè),挖掘出巨大的市場潛力。
MaaS模式下的人工智能行業(yè),也不再只是科技巨頭的市場,那些多年深耕細(xì)分行業(yè),具備行業(yè)模型精調(diào)能力的公司,可充分利用自身懂市場、懂業(yè)務(wù)、懂客戶的優(yōu)勢作為通用大模型和企業(yè)之間的中間層,創(chuàng)造出更好的細(xì)分產(chǎn)品。而底層服務(wù)方面,新型云計算公司將迎來發(fā)展機遇,主流商業(yè)模式將從IaaS變?yōu)镸aaS,以模型服務(wù)為新的業(yè)務(wù)增長點。
大模型已開啟AI新時代,未來市場潛力和想象空間巨大,讓我們拭目以待。
備注:本文僅作為產(chǎn)業(yè)科普,不提供任何投資建議。
參考資料:《人工智能行業(yè)專題報告:模型即服務(wù)》、《MaaS:Model as a Service 模型即服務(wù)》、《深度解析:為什么說MaaS是云計算的未來?》、《人工智能:模型即服務(wù)(一)》、《MaaS模型即服務(wù):AI領(lǐng)域獨特商業(yè)模式,降低AI使用門檻》、《阿里推出“模型即服務(wù)”,開源300+AI模型》