- ChatGPT癲狂百日
- 2023年04月11日來源:北京商報
提要:朱雷認為,目前國內的大廠更多出于一種通盤的考量,一開始就做一個非常通用非常強大的基礎設施,但技術路線還沒有確定,因此國內到底誰能做成通用的基礎設施,很難在一年內得出結果,可能要3-5年的時間才能有一個初步的判斷。
4月10日對人工智能領域來講是熱鬧的一天。商湯科技“日日新”、昆侖萬維“天工”大模型產品發布,前搜狗CEO王小川創立百川智能,宣布開啟人工智能大模型領域創業……盡管幾天前馬斯克以及超過1000位科技人士簽署了聯名信,呼吁暫停先進AI的開發,但中國的互聯網圈、創投圈仍為之興奮不已。
在過去的100多天里,ChatGPT卷起巨大的風暴。由此引申的是技術、產業進步帶來的新矛盾——大模型的不斷迭代,應用場景的不斷豐富,當人工智能逐步失去“邊界”,仿佛AIGC是一個潘多拉魔盒,既然被打開了,就不會只放出一種影響。
油門剎車,踩哪個
如果以ChatGPT為關鍵詞在百度指數上進行搜索,這條來自互聯網的曲線就會清晰地告訴我們,這波AI的浪潮正式成為爆點的時間,是今年2月8日。當天,ChatGPT搜索指數達到849565,至今仍未被超越。
那一天發生了什么?當天凌晨,微軟正式發布整合了ChatGPT系統背后技術的新版必應搜索引擎,人們認為,這是微軟多年來距離超過“搜索之王”谷歌最近的一次。傍晚,“阿里版”ChatGPT正處于研發中的消息不脛而走。再加上此前一天谷歌Bard和百度“文心一言”的預告,積累下來的討論徹底引爆了ChatGPT的話題。
如果說在這之前的一個多月里,ChatGPT的熱鬧更多屬于圈內人,那么重量級玩家的相繼入局,則成了ChatGPT正式出圈的關鍵推手。
很快,人們就意識到這只是一個開始。5天之后的2月13日,王慧文高調入局,一封“AI英雄榜”炸開創投圈。3月15日,搶在百度文心一言發布的前一天,OpenAI正式推出GPT-4,OpenAI CEO山姆·奧特曼直言,“這是我們迄今為止功能最強大的模型”。
再后來,重磅的消息像是下餃子,一個接著一個。
“華為盤古大模型4月發布”的傳聞還沒落定,4月7日,阿里云官宣大模型“通義千問”邀請測試的消息再度震撼市場。與此同一時間線運行的,還有大廠人紛紛投身AI大模型創業大軍,越來越激烈的人才爭奪戰,以及越來越多的企業透露AI領域的布局。
“AI的iPhone時刻。”不久前,在英偉達2023年GTC大會的主題演講上,其創始人黃仁勛用這樣一句描述概括了當下的現狀。英偉達給這場大會定下的廣告語是:“切勿錯過AI的決定性時刻。”
許是樹大招風,當巨大贊譽出現的同時,“人類威脅論”尚未產生實效,一場監管風暴卻已經率先成型了。3月的最后一天,意大利出手禁止使用ChatGPT。一周之內,德國、法國、愛爾蘭、西班牙等歐洲國家的監管機構也相繼表達了考慮暫時禁用ChatGPT的可能性。
在這之前,一份超過1000名科技領袖和研究人員聯名的公開信,更是呼吁所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統至少6個月。信中寫道,“廣泛的研究表明,具有與人類競爭智能的人工智能系統可能對社會和人類構成深遠的風險”。
馬斯克正是聯名者之一。
“邊界”在哪兒
“AI一定會產生自我意識,留給人類的時間不多了。”這是360集團創始人周鴻祎的判斷。他將AI意識的產生類比人腦意識的產生,人類腦容量里神經網絡連接數大概是100萬億,當大模型的參數到達10萬億時,意識可能就自動產生了。
AIGC可以看作是AI算法的一次重大突破,朝著重構人類生產力和生產關系的方向變革,AIGC產業又可以大致分為基礎大模型和應用兩個層面。
底層大模型的性能基礎,直接決定了AIGC的上層建筑。公開資料顯示,GPT-1到GPT-3的參數分別為1.17億、15億及1750億。OpenAI尚未公布更多關于GPT-4的數據信息,但《紐約時報》曾提到,GPT-4學習的數據規模要比GPT-3.5大得多。
當下所有關于ChatGPT甚至AIGC的恐懼和不安,最終都能匯聚到這個底層建筑的“失控”,在業內,人們把這種失控稱之為“不可解釋”。
元語智能聯合創始人兼COO朱雷表示,當下國內外一個普遍的擔憂就是,AI是否會完全取代人類,這背后的原因在于,模型本身是不可解釋的,包括OpenAI的很多算法工程師,都無法詳細地推理出來,這些大量的參數為什么會產生這樣的效果。
“這其中沒有強大的科學依據,也沒有比較好的測評方法,這意味著模型本身無法從各個維度上設置指標,進而去控制模型減少風險的存在。”朱雷稱。
在朱雷看來,暫停大模型研發的呼吁,就是為了想辦法去研究大模型為什么會有這種強大的能力,只有找到答案,才能在未來研究下一代人工智能系統的時候,知道如何去做監督,否則監督就會遠遠落后于大模型的進化速度。
瑞萊智慧孵化自清華大學人工智能研究院,致力于貝葉斯深度學習、AI對抗攻防等第三代AI技術的研究,其聯合創始人蕭子豪提到,ChatGPT能力升級下,偽造成本和難度將變得更低,而且這類內容難以分辨和追蹤,治理難度也更大。
ChatGPT只會給出整合后的單一回答,對普通人來說,除非自身知道答案,否則很難判斷它是不是在“胡說”,或者用戶自己通過其他可信渠道去進行驗證。這也是目前ChatGPT在信息準確性方面最為詬病的一點。
蕭子豪稱,技術方面,有一些方法被提出,比如針對合成文本的鑒別、數字水印等,但還存在難點。因為機器與人類撰寫的文本差異性特征較少,真人說話的方式也可能是多變的、結構有誤的,因此很難單純從文本本身就鑒別出是否由ChatGPT生成。
4月10日,中國支付清算協會(以下簡稱“協會”)發布消息稱,近期,ChatGPT等工具引起各方廣泛關注,已有部分企業員工使用ChatGPT等工具開展工作。但是,此類智能化工具已暴露出跨境數據泄露等風險。協會向支付行業發出倡議,謹慎使用ChatGPT。
除了虛假信息、數據泄露,北京卓緯律師事務所合伙人、律師孫志峰認為,AIGC的發展還會帶來諸如人工智能生成內容知識產權或競爭法保護方式、知識產權權屬、機器生成內容侵權方認定等問題;人工智能生成違法、違反人倫內容或產品責任追究,以及遏制擴散傳播;人工智能造成部分崗位或生態滅失引發的社會及法律問題。
但孫志峰也提到,沒必要因為新生某個領域而專門針對這個領域進行綜合立法,可以在總結和預判的基礎上,對一些規定進行適應性修訂。
AI,投還是不投
科技圈在battle技術,資本圈在battle藝術,投資的藝術。
4月10日,ChatGPT概念股忽然遭遇重挫,截至收盤下跌6.13%,創下該概念指數推出以來最大單日跌幅。云從科技、三六零、科大訊飛等集體跌停,昆侖萬維、海天瑞聲、藍色光標、同花順、拓爾思等跌逾10%。
但盤后公布的龍虎榜數據顯示,科大訊飛、拓維信息、昆侖萬維、景嘉微等板塊熱門概念股均有機構現身買入。以科大訊飛為例,3家機構現身該股買入榜前五,合計凈買入1.94億元;賣出榜上,一家機構賣出近1.25億元,機構總體凈買入近7000萬元。
不久前,神農投資陳宇和東方港灣但斌在社交媒體上激烈交鋒三個回合,主題依舊是AI。前者認為這次的AI行情是一次“有意義的亂炒”,但后者則堅定地認為,“這一波概念炒作,一旦被套,不知猴年馬月解套”。
狂熱和謹慎,是資本市場上截然不同的兩種態度,也是這一波AIGC浪潮爆發下難以回避的一體兩面。
狂熱的一面在于,理智的挑戰沒能澆滅資本的熱情。Wind數據統計顯示,今年以來,ChatGPT概念板塊成交額從160多億元攀升至850多億元,整個板塊指數漲幅已逾50%,部分概念個股年內累計漲幅更是高達300%。目前ChatGPT概念板塊整體平均市盈率高達逾130倍。
謹慎的一面在于,當市場過熱,泡沫就成了人們擔心的必然選擇。華創證券首席策略師則在報告中稱:“AIGC交易明顯過熱。”安信證券也在研報中表示,短期需要承認人工智能AI+數字經濟(TMT)行情存在熱度偏高的跡象,出現高位調整的可能性在上升。
不過從AIGC領域的投資來看,知路研修集團董事長付霖提到,目前國內還是比較冷靜的,通常處于只看不投的狀態,相較而言國外才更“瘋狂”。付霖稱,“只要是搞這個的,不管具體是做什么的,都會有投資”,“前兩個月美國那邊感覺是個項目都拿到融資了”。
在這之前,付霖剛剛現身于北京一場人工智能領域重點創新項目的路演活動中。早在2021年,付霖就將GPT模型應用于教育領域,進行自己企業的降本增效。目前他的企業已開發了3款基于GPT-3.5模型的教育類應用,其中一款是一個多模態測評系統,協助教師進行論文和視頻答辯的自動評分。
教育被認為是人工智能落地的關鍵場景之一,也一度是ChatGPT引起巨大爭議的場景之一。通常來講,批改作業以及對學生作業進行評估,是占據教師教學精力非常龐大的一個部分。
香頌資本董事沈萌總結稱,一些長期關注AI產業發展的基金會投相關的企業,但投資比例和總金額都不會太高,因為風險系數太大,而且太燒錢,一旦遇到不靠譜的,就有可能打水漂。另外這些基金相對來說也會對這一領域的投資持有更審慎的態度,畢竟這并不是一個劃時代的技術,而是技術演進的必然結果。
如果從抽象的技術角度來看,ChatGPT似乎只是一個擁有龐大算力、可以整合海量信息的“量變”,但它所產生的所有東西都是有跡可循的,而沒有實現強人工智能的“質變”,即創造出什么樣的東西。它更像是信息技術發展迭代的其中一環,起到的無非是提高效率的作用,而不是一種新時代能夠推動生產力跨越式提高的動力。
今年全國兩會期間,國家新一代人工智能治理專業委員會委員曾毅也曾提及,ChatGPT是一個人工智能領域現有工程技術的組合創新,在用戶體驗上有顯著提升,但并非科學的突破。它使用自然語言處理領域的幾項關鍵技術,都是幾年前學術界已驗證有效、相對比較成熟的技術。
至于資本層面,沈萌認為,ChatGPT只是一個營銷出來的熱點,畢竟砸了這么多錢,不搞出點動靜來,可能就要“斷炊”了。
一些私募狂熱的背后,也要看到問題的本質:他們是要無私地推動人類社會的進步,還是為了割韭菜?
國產,誰先“出道”
3月末,英特爾聯合創始人摩爾去世。
人們在回顧其傳奇一生的同時,也再次回憶起了那個著名的“硅谷與‘八叛徒’”的故事——1957年,摩爾與另外7名員工集體跳槽成立了仙童半導體公司,但這次“叛逃”卻意外打開了世界芯片產業快速發展之路,美國加州圣塔克拉拉谷地也得以贏得了“硅谷”的稱號。
這種“叛逃”逐漸被褒化成了一種叛逆傳統的創業精神,如今的AIGC產業,似乎在上演一個新版“硅谷與‘八叛徒’的故事”,其中又以底層大模型最甚。
上個月,前字節跳動視覺技術負責人王長虎離職創業,方向將聚焦于生成式AI的視覺多模態算法平臺,并關注視覺相關的各大垂直應用場景。
在這之前的幾天,阿里前技術副總裁賈揚清也在朋友圈宣布,其和團隊已從阿里“畢業”,下一站將是AI創業,方向為AI大模型底層技術相關。
一同踏入大模型創業賽道的,還有創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創始人李志飛等人。
4月10日,王小川官宣了他的AI大模型公司“百川智能”,目前已獲得5000萬美元啟動資金。此外,公司將會在年底發布to B領域的大模型產品。王小川說:“追上ChatGPT水平,今年內可能就能夠實現,但對于GPT-4或者GPT-5,可能需要三年左右的時間,應該不會低于兩年。”
有人創業,自然有人深耕,資金實力雄厚的大廠,沒一個甘愿落得下風。
3月16日,號稱“All in AI”了幾年的百度終于推出文心一言大語言模型。
3月下旬,盡管沒有官方認證,華為盤古NLP大模型的消息卻忽然走熱。幾乎是同一時間,三六零創始人周鴻祎在一場演講中首次亮相了360大語言模型產品。網友戲稱,“紅孩兒”出世了。
4月9日晚些時候,360傳來了最新消息:基于360GPT大模型開發的人工智能產品矩陣“360智腦”率先落地搜索場景,將面向企業用戶開放內測。
4月7日,阿里云官宣大模型“通義千問”邀請測試,但截至北京商報記者發稿,該內容顯示已被發布者刪除。緊接著,京東集團副總裁何曉冬也在一場論壇上表示,京東將在今年發布新一代產業大模型,言犀是“京東版”ChatGPT。
朱雷稱,AIGC產業主要分為三層架構,底層做通用大模型,屬于基礎設施的能力層,類似于OpenAI以及谷歌的Bard等。
中間層中的一種類型是本身不做大模型,而是一個集成平臺的架構,底層封裝一些已有的模型,或在已有模型上做指令微調,另一種可能會做一些推理的AI框架,實現對模型訓練和推理過程的優化。
最上層的就是一些行業解決方案或者說是一些應用,包括微軟的copilot以及國內外很多演化出來的App和網站等。
朱雷認為,目前國內的大廠更多出于一種通盤的考量,一開始就做一個非常通用非常強大的基礎設施,但技術路線還沒有確定,因此國內到底誰能做成通用的基礎設施,很難在一年內得出結果,可能要3-5年的時間才能有一個初步的判斷。
而且通用的大模型解決不了具體行業的問題,尤其是在國內,大部分高質量中文語料都在行業內,而不在公域的互聯網內,即便是大廠也很難拿到行業數據。從這個角度上看,專用的模型在特定領域的效果一定要比大公司的通用模型更合適。
朱雷預計,未來通用的大模型大概會有3-4個,行業領域很可能就會百花齊放,具體到每個行業,也可能會有1-2家比較優質的大模型領跑。
在朱雷看來,目前國內大模型其實遠沒有到泡沫的階段,做大模型的總共也就幾家企業,之所以會給大家造成這樣的印象,是因為一些重量級玩家的加入,將事情本身夸張化,國外一些新的熱點也會營造出一種市場爆發的錯覺。
“但今年四季度,隨著玩家越來越多,不排除出現第一個泡沫的可能性。”朱雷稱。
付霖也認為,未來AI可能會涵蓋所有的行業,從一個比較扁平的大模型發展到每個領域都出現垂直的應用和機器人。雖然目前出現了一定的混亂,但當有更多的條規對其進行約束時就會好很多。
“我們可以將其理解為時代的車輪已經開始轉動了,中途不可避免地會遇到一些小石頭,但都不可能阻擋車輪整體的轉動。”付霖稱。
版權及免責聲明:
1. 任何單位或個人認為南方企業新聞網的內容可能涉嫌侵犯其合法權益,應及時向南方企業新聞網書面反饋,并提供相關證明材料和理由,本網站在收到上述文件并審核后,會采取相應處理措施。
2. 南方企業新聞網對于任何包含、經由鏈接、下載或其它途徑所獲得的有關本網站的任何內容、信息或廣告,不聲明或保證其正確性或可靠性。用戶自行承擔使用本網站的風險。
3. 如因版權和其它問題需要同本網聯系的,請在文章刊發后30日內進行。聯系電話:01083834755 郵箱:news@senn.com.cn