文章編號:69時間:2025-01-06人氣:
用微信掃碼二維碼
分享至好友和朋友圈
出品|網易科技《后廠村7號》欄目(ID: tech_163)
為什么中國沒有出現ChatGPT?我們的差距在哪里?要投入多少資金才能與之抗衡?
“本質是專注和決心,是有沒有做到AI First。”小冰CEO李笛直言,從技術層面來講,的技術沒有太多的秘密,中國人的技術不亞于歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
“背后的大模型是大資本的游戲,長期持續投入真的很貴。”資深研究專家田濤源告訴《后廠村7號》,在ChatGPT出現之前,較多企業不會選擇把錢燒在一個未知的機會上。“GPT3.5訓練一次需要花費300-460萬美金,還只是算力的成本,沒算人才的成本,Open AI一共375人左右,一年工資開支就要2億美金,AI算力開支5億美元,需要雄厚的資本支撐。”
但ChatGPT的驚艷四座,AIGC的技術質變,投射到廣闊的中國互聯網上,引燃了AI從業者的光榮與夢想、激情與野望,在噴薄、在躍動。
AI創業者陳東記得,臨近過年的寒夜,在北京的朋友家里,他們吃著開心果、瓜子,徹夜交流,一晚上的話題幾乎都與AIGC和ChatGPT有關,雖然不少人對此還是半懂不懂,卻富有熱情。
在被ChatGPT驚艷的同時,國內業界也在思考:AIGC的商業模式是什么?哪些方向存在更多機會?中國版ChatGPT的危與機?
(圖為張頎AI繪畫作品,由受訪者供圖)
中國AIGC生態初現:大廠搞基建,小廠做創新
當下,全世界互聯網都刮起了一陣ChatGPT風。這款由OpenAI推出的全新聊天機器人模型,不僅可以回答人類的提問,承認自己的錯誤,還能作詩、編程甚至幫助大學生完成論文。它讓馬斯克感嘆“好得嚇人”,也代表AIGC向全世界喊出了“芝麻開門”。
在中國,圍繞AIGC生長出的市場生態,已嶄露頭角。
“AIGC并不是一個多么新鮮的概念。”陳東談到,大廠很多2C應用里,已經有不少內容是AI生成的,甚至出現過廣告對外宣傳已經在大規模使用AIGC技術,至少兩年前就有這個方向的創業團隊出現,并得到了一線美元基金的青睞和投資。
在他看來,AIGC不只是大廠的機會,也將新起很多創業公司。一類公司偏底層,在新場景中孕育大模型的突破,產研類似DALL·E、GPT等產生很多新模型;另外是在應用層中,也會出現很多新公司,包括生成文字、圖像、視頻、數字人等等。
在趕超ChatGPT的巨大誘惑下,大廠率先打響了追平基礎大模型差距的“攻堅戰”。
2月7日,經百度確認,百度類ChatGPT項目名字確定為“文心一言”,英文名ERNIE Bot,預計3月份完成內測,面向公眾開放。除百度外,還有騰訊、阿里巴巴、快手、字節跳動、京東、網易、360、商湯、美圖等大廠都在AIGC領域有所投入,加入到這場全球新一輪AIGC技術競賽。
“好的人工智能大模型是非常費錢的。”在資深人工智能研究專家田濤源看來,這股預訓練大模型的風潮之下,其實是一場拼數據、拼算力、拼財力的軍備競賽長跑。
他介紹,基礎模型GPT3.5訓練一次需要花費300-460萬美金,還只是算力的成本,沒算人才的成本,Open AI一共375人左右,一年工資開支就要2億美金,算力開支5億美元。“這真是很貴,而且前面那么多年是沒商業回報的,基礎模型的參數又是持續優化的過程,隨著商業化進展加速要不斷進行訓練,需要雄厚的資本支撐,確實是小公司用不起來。”
但對于基礎大模型、應用大模型未來的商業價值,行業從業者都有共識、有期待。
“AIGC生態最值得關注的就是大模型的建設能力,這將成為AIGC長期價值的重要增長點。”AI創業者“web3天空之城城主”激動地說,“這是用短期的投入換10年后千倍收益的事情。”
另一面,在細分行業中,AIGC的造富速度同樣讓人們睜大眼睛。
去年10月19日,以文字生成為主的AIGC項目Jasper.Ai完成了1.25億美元的A輪融資。完成融資后,憑借15億美元的估值躋身AIGC賽道獨角獸俱樂部。就在Jasper.Ai宣布融資的前一天,Stability AI成功融得資金1.01億美元,投后估值達10億美元。
在AIGC的垂直技術場景中,按照模態區分,可以分為音頻生成、文本生成、圖像生成、視頻生成等細分領域,均已出現中國企業的探索身影。
文字生成:小冰、Glow、清華九歌、彩云小夢、寫作貓、瀾舟科技、元語智能等。
圖像生成:百度文心一格、盜夢師、TIAMAT、達利AI、6pen、圖宇宙、Artflow等。
視頻生成:抖音的剪映、快手的云剪、影譜科技、藍標分身、商湯智影、詩云科技的Movio等。
音頻生成:網易天音、StarX MusicX Lab、DeepMusic等。
數字人:啟元世界、倒映有聲等。
從獨角獸到大廠,從使用者到投資人,從業界到學術界,AIGC在應用層的創新引發了廣泛的關注。
資本涌入、互聯網巨頭紛紛布局的背后是AIGC巨大的經濟價值和市場規模。
Gartner預測稱,到2026年,全球30%的企業機構將擁有用于數字人和元宇宙的產品與服務。麥肯錫則預測,到2030年全球元宇宙相關支出或達5萬億美元。更值得期待是,AIGC正在逐步探索性地進入真實工業生產鏈條,應用到營銷、游戲、代碼、生命科學等多個領域。
尤其是一級市場,投資人的脈搏正在變快。
明勢資本合伙人夏令直言,2021年年底他就和同事在梳理AIGC領域的機會,并且做了投資布局。AIGC讓他感到興奮的有三點:一是,用戶在環、端到端數據驅動模型的上限極高,模型迭代+高質量反饋能帶來持續效果提升;二是,以抖音、小紅書為代表的內容制作再分發的邏輯有可能變為用戶與AI系統共同創造個性化內容的邏輯;三是,新一代的AI技術范式將有機會讓人類腦力勞動真正商品化。
去年底,知春資本董事總經理謝夢暉就觀察到了這波創業的列車再一次提速。一個側面反映,“我們之前投資的相關領域被投企業,尤其是基于ChatGPT模型進行商業化衍生的公司,開始頻繁受邀參加各種技術和投資論壇。”
令他感到驚喜的是,這輪技術的迭代將推動創造商業的新增量。“在新的生產力基礎上,現有的生產關系必然重構,對應的經濟體系、組織模式必然會發生變革,創造力的估值將會呈指數級提升。”
AIGC的商業模式是什么?
生于1988年的創業者陳東意識到自己正身處歷史之中,連續許多天大廠宣布入局chatGPT的消息席卷著他的注意力,創業者的朋友圈就像創投世界的溫度計,“之前搞元宇宙、web3甚至NFT的都要搞AIGC”。他和朋友們感嘆太瘋狂了,“像王慧文這種大佬,在朋友圈發布人工智能入局宣言,說5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊。”
雖然陳東目前還沒找到明確的方向,但已經和投資人喝上了咖啡,“他們其實也想更了解這個行業,尤其是如何商業化。”
自AI繪畫工具StableDiffusion開源以來,國內大量主打AI繪畫的網站和APP如雨后春筍般涌來。AI畫師張頎作為AI繪畫工具重度使用者,一些平臺內測階段就會主動找上門,讓他提看法,找bug。“有的甚至前端的開發人員直接過來問,要如何調整才能提升大家的付費意愿?”
(圖為張頎AI繪畫作品,由受訪者供圖)
產業圈和投資圈對于AIGC,仍有一串真正嚴肅、令人如鯁在喉的問題:AIGC的商業模式是什么?在中國像open AI這樣的公司在哪里?如何做成一個產品,既要普惠化,又要足夠深,足夠廣?
借鑒美國的商業化經驗,夏令大致將AIGC領域分為三類商業模式:一類是OpenAI這種專注于做大模型的公司,提供API,做細分場景應用的公司需要去調用它的API,按API去付費;第二類公司是既做大模型,又直接做垂直一體化應用的公司,比如在AI生成圖像很火的公司 Midjourney,第三類公司是調用第一類公司的大模型API,基于對細分場景的深刻理解,重點開發具體場景的AI應用,比如Jasper這樣的公司。
但對于像OpenAI這種提供API的商業模式,在中國能否真正work,還是個問號。
田濤源講,這個方向不僅在研發階段要承擔巨大的人力成本、算力開支壓力,即便真的推出效果類似ChatGPT的大模型,數據成本、調優、AI倫理優化依然居高不下。“目前ChatGPT每回答一個問題,成本至少要一美分,以這樣的方式去做商業變現,面臨著高昂的成本、海量的行業優化需求、多條科技戰略路徑決策選擇。”
同時,ChatGPT類似第一代iphone,上面尚沒有成功的爆款APP(例如憤怒的小鳥),它離穩定性的商業服務還存在距離,沒有跨過工業紅線。在他看來,當下還處于從實驗室基礎技術轉向產業界爆款應用服務的過程中,處于很早期。“但至少讓大家看到了基礎模型巨大的跨領域服務能力,找到了通用人工智能的一條可能成功的路。”
與此同時,在國內真正能做AI大模型的公司其實是極少的。
夏令觀察,但凡能做底層的模型,不管是去做語言大模型的,還是去做強化學習的,只要以技術見長,以工程化產品化的思維做底層模型的公司,融資都非常不錯,過去一兩年VC都要搶著投進去。“可能資本的溢價沒有像美國那么夸張,但一兩年時間做到10億美金估值的公司還是有一些的。”
王思捷和啟元世界團隊此刻正在經歷創業以來最繁忙的日子:由于入局較早,從算法到工程整個一套的體系積累下來的能力,已經自建出百億參數的game AI和數字人AI垂類大模型。風口降臨后,有頂級游戲制作人已經主動上門尋求合作。
他引以為傲的是,這套垂類模型的訓練和推理成本可以做到比Open AI同參數規模的模型低一個量級。在王思捷看來,先構建更小的垂類模型(比如百億參數、十億參數),讓數據飛輪和模型訓練能夠很好結合,垂類模型在某些領域可能比open AI的效果更好成本更低。“這種想象能力是在中國更能跑通的。”
小冰CEO李笛則直言AIGC商業回報賽道最大的是數字人,“它的客單價明顯會更高,我們做過終端內容的生成,感覺這是個菜市場般的內容市場,單價非常低,直到我們將AI生成能力捆綁到數字人身上,平均客單價迅速從20萬提高到了300萬,當然你的成品質量要足夠高。”
但對于只懂用API調用生成內容的創業團隊,參與本次采訪的受訪者大多表示,“價值有限。”
李笛試圖放出一個警惕信號,奉勸想要進入AIGC賽道的創業者,要謹慎使用大廠提供的可調用接口,盡可能自建垂類模型。
“API調用的商業模式掙不到錢,所以即便是為了發展,大廠也一定會跳進去,去做生態鏈上面其他生態類企業的事情,首當其沖就是直截了當應用他們的技術來提供服務的人。”他判斷最終的結果,“你要做起來一定會被吃掉,骨頭都不剩。”
中美差距:不在技術,在專注
在被ChatGPT驚艷的同時,國內業界也在反思:為什么中國沒有出現ChatGPT?
事實上,此前不乏有國內公司雄心勃勃想登上中文版ChatGPT的“王座”。但在可能的未來和確鑿的現實面前,在巨額投入和業績報表的沖突面前,選擇了猶豫不前。
“大模型的技術沒有太多的秘密。”李笛直言,在ChatGPT出現前,小冰從2017年就開始做AIGC相關的東西,從技術層面來講,中國人的技術不亞于歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
事實上,國內,一群最勇敢、懷抱最狂野夢想的年輕創業者,已經帶著自己的AI生成產品挑戰海外市場,與世界一流的上市公司對標產品能力。
“AIGC 這件事要真正落地,門檻不僅僅是技術水平,更重要的是從 AI 到用戶到數據,再到產品體驗能夠循環起來的一個飛輪。”從目前拿到手的海外用戶反饋,他判斷,“在這個方向上,我們現在技術和產品體驗上,都是比較領先的。
對比海內外的團隊,梁望最大的感受是大家對于創新的理解和投入度存在差異。例如,面對那些可能短期甚至中期內都看不到回報的創新,團隊是否仍然擁有無論如何都要去做出來的精神和決心。
作為企業的一把手,李笛也深刻認知到中國和北美的商業和科技環境的不一樣,國內大多企業沒有那么多的錢會燒在一個未知的預測上。“要花很多的錢,要花很多時間,短期內難有商業價值,誰也不知道這個是不是可行。”
“本質是專注和決心,是有沒有做到AI First。”李笛直言,好幾年前看到Open AI,他們做到了全情投入,這也是唯一的不同,Open AI花了足夠的時間和精力在賭,敢于相信一個暴力出奇跡的大模型,但他們那個賭小冰確實不敢賭,“創業生死一線間,某種意義上,如果Open AI不推出Chat GPT,他們今天可能很堪憂了。”
田濤源看來,這件事給大家一個啟發:我們對人工智能硬件(例如芯片)非常重視,但是人工智能的基礎軟件(例如大模型、訓練框架、大數據工具鏈),是不是長期投入不足、沒有足夠重視?有沒有決心進行長期的基礎研發投入?
中國投資與產業界更在乎短期商業回報上的表現,即快錢。“在中國是大家看到哪個技術到了商業價值轉化的臨界點,所有人一擁而上,對許多大型科技或實體行業龍頭企業來說,AI基礎科研重視程度不足,缺乏大模型自研能力和戰略定力,大家以快速產出的應用為導向,而技術算法的研發必須要很長時間的積累。”田濤源講。
但一些極擅長工程化的中國AI公司入場,也必將攪動全球AIGC市場。
夏令講中國優秀的AI初創公司擁有非常明確的一點優勢,就是具備很強的工程化能力,搭建一個相比openAI成本更低、迭代效率更高、更滿足明確優化目標要求的模型是可以實現的。
同時,中國整個應用場景具備足夠的豐富性。“我們這么大的人口基數,產業數字化基礎也已經初步具備,中國在高質量反饋數量上有優勢,而這對新一代AI模型格外重要。我們看重的AIGC公司要有比較好的工程化能力,對中國實際的商業場景有自己獨到認知,我們認為只有這樣的公司最有機會能夠跑出來。”夏令講。
隨著ChatGPT爆火,這一舊金山誕生的技術引爆了全球人工智能產業,AI 公司近乎全面入局,經濟鏈條的最上游資本市場也出現了震蕩,預示變革的信號彈一枚接一枚地炸響。
(圖為張頎AI繪畫作品,由受訪者供圖)
“中國一定要有自己的GPT-4,即基礎模型(大模型)。”
田濤源強調,“中國的科技創業團隊應有危機感。”ChatGPT也好,基礎模型也好,越多的開發者、越多樣化的高質量數據、使用場景,對基礎模型的反饋和優化就是越有價值。“誰先去做強化學習,誰就具備先發優勢,這對于我們是一個很大動力和壓力。”
而在機會的另一面,是所有ChatGPT面臨的最大門檻——“安全和合規”。
2016年,微軟就做出了聊天機器人,可以實時地通過用戶反饋,并修改自己的回答,但一經發布后,24小時就被教成了種族主義者,很快就被下架了。“我們的實驗室也有自己的對話機器人,過去這個是不敢放出來的。”一位頭部AI公司創始人告訴《后廠村7號》欄目。
談到具體落地,資深人工智能研究者田濤源提出:“OpenAI官方在2020年7月發布的《Language Models are Few-Shot Learners》報告中對提出了ChatGPT背后語言大模型的能力邊界與挑戰提醒:
1、表達問題:語義重復,長篇幅段落中失去連貫性、自相矛盾,偶爾不符合邏輯
2、缺少物理常識:GPT-3很難回答“如果我把奶酪放進冰箱,它會融化嗎?”
3、訓練效率差與世界模型:GPT-3與人類語言訓練效率存在顯著差距,但GPT-3在預訓練期間學習的文本規模遠大于人類一生中看到的文本,以物理世界中額外信息為基礎、算法改進都可能提升效率。
4、不確定性:GPT-3的少樣本學習存在不確定性、模糊性,未來在準確理解少樣本學習原理的基礎上,能在模型推理時“真正從頭開始”學習新任務。(不清楚人類“從零學習”是否會受以往知識的影響)
5、大模型適用性不好:不方便進行推理,實用性不好,大模型蒸餾到可管理的大小,GPT-3等大模型包含廣泛的技能,但在特定任務中并不需要,原則上激進的蒸餾“瘦身”是可能的方法,但在對千億參數的大模型上還沒有過嘗試,可能會遇到“決策不易解釋”、 “輸入的預測不易校準”、 “訓練數據的偏差”(數據偏見帶來模型偏見,社會倫理影響)。”
“我看到像Open AI的負責人現在也跳出來,主動地說希望被監管。”
在上述AI頭部企業創始人看來,這種大模型的最終落地,必然要接受非常嚴格監管。“如果放任發展,過十年它能讓美國那一代學生的教育水平大幅度下滑。”
在他看來,ChatGPT真正在C端出圈,離不開想要借此抄作業的學生,背后涉及的是AI倫理問題。“在美國,10個學生有9個過去幾個月迅速知道了ChatGPT,并通過它寫作業上交,這是它會火爆的一個重要的推手,它解決了實際問題,但是這個解決問題的方法是不正確的。”
他對資本市場所謂的天氣預報不感興趣。這段時間,不乏有投資人找過來,提議去做ChatGPT類似的大模型,但他沒有接受這根橄欖枝。“不是特別愛搶這種風頭,我是不會推出一個讓學生抄作業的東西,不管賺再多的錢。”
他希望,選擇去做ChatGPT類似應用的同行,能夠更多考慮AI倫理的自律問題,提前預估學生拿到它會做什么?被迅速鋪開怎么辦?“盡力做好安全和合規吧,讓它last for long,能夠持續的存在。”
業內有共識,對于ChatGPT的討論,未來幾年都不會停歇。
但明確的是,ChatGPT以及其對應的大模型發展,就是未來的一個技術革命,可能還沒有到達大家想象的那種令人恐慌的程度,但確實會讓未來幾年的創新得以釋放。
在田濤源看來,大家現在執著于去搞ChatGPT,放眼整個人工智能未來,只是其向前邁進的一塊墊腳石。“再往上走,還有更多巨大的機會。”
在他的想像中,AI可以推動人類對航天的探索、對新能源的探索、對新材料的重大發現,隨著它對物理規律認識的越透徹,對人、對環境、對生命體的認知越來越深刻,能夠逼近一些人類認知范圍以外的未知知識,甚至具備新知的可能性。
在這場或許比移動互聯網更加顛覆的大變革里,對于中國AI企業,距離終點仍有漫長的道路要尋找、摸索、攀登。
(應受訪者要求AI創業者陳東為化名)
出品|網易科技《后廠村7號》欄目(ID: tech_163)
內容聲明:
1、本站收錄的內容來源于大數據收集,版權歸原網站所有!
2、本站收錄的內容若侵害到您的利益,請聯系我們進行刪除處理!
3、本站不接受違法信息,如您發現違法內容,請聯系我們進行舉報處理!
4、本文地址:http://www.yetkj.com/article/69.html,復制請保留版權鏈接!
“五小時飛行圈”,中外游客雙向奔赴,免簽,泰國,韓國,飛行圈,中國游客,雙向奔赴,馬來西亞,中外游客,外國游客
2025-01-09 08:59:34
生存壓力之下,日本汽車制造商將更緊密合作,本田,日產汽車,動力車型,汽車制造商,豐田汽車公司,日本汽車工業協會
2025-01-09 08:57:36
年過四十的女人,冬季穿搭保暖時髦兩不誤!這樣穿才能美到老,大衣,高腰,毛衣,長裙,女人,緊身褲,搭配技巧,冬季穿搭,氣質魅力
2025-01-09 08:57:29
女人過了40歲穿衣別糾結,真該試試這些穿搭,溫柔又顯女人味,穿搭,大衣,內搭,半身裙,羽絨服,身材比例
2025-01-09 08:57:15
AMDRX9070XT海外上架,預計于1月23日發售,顯卡,華碩,xt,rx,發售,amd,臺積電
2025-01-09 08:52:55
今冬何時能去未名湖冰場玩耍?北大:還需等待進一步降溫,冰場,北大,未名湖,博雅塔,臨湖軒,北京大學
2025-01-09 08:49:54