- 階躍星辰亮相 WAIC 2024 首發(fā)“萬億”和“多模”大模型
- 2024年07月06日來源:南方企業(yè)新聞網(wǎng)
提要:可以想見,隨著AI技術(shù)的不斷進(jìn)步和圖像生成大模型的持續(xù)發(fā)展,AI技術(shù)在藝術(shù)創(chuàng)作領(lǐng)域的應(yīng)用將進(jìn)入一個新的階段。未來,人們將能夠通過AI技術(shù)更便捷、更高效地實現(xiàn)自己的創(chuàng)意和想法,為藝術(shù)創(chuàng)作帶來更多可能性。
7月4日-7日,2024 世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)在上海隆重開幕。大模型新生力量階躍星辰首次亮相世界人工智能大會,在琳瑯滿目的大會展館中,階躍星辰的展臺如一股清流。

階躍星辰成立于 2023 年 4 月, 自成立起,階躍星辰堅定投入攀登 AGI 通用人工智能的高峰。階躍星辰創(chuàng)始人、CEO姜大昕博士認(rèn)為,要實現(xiàn) AGI,“萬億參數(shù)”和“多模融合”缺一不可。目前,公司已經(jīng)聚集了一批海內(nèi)外人工智能領(lǐng)域的頂尖人才,堅定探索實現(xiàn)通用人工智能的道路。
WAIC 2024 的現(xiàn)場,階躍星辰展示了自3月份之后的研發(fā)進(jìn)展和應(yīng)用成果。在不到100天的時間里實現(xiàn)了 Step 系列通用大模型矩陣的全面升級,覆蓋從千億參數(shù)到萬億參數(shù),從語言到多模態(tài),從理解到生成的全面能力。 其中,階躍星辰首發(fā)了三款 Step 系列通用大模型新品,以印證“萬億”+“多模”策略,他們是:Step-2 萬億參數(shù)語言大模型正式版、Step-1.5V 多模態(tài)大模型、Step-1X 圖像生成大模型。
姜大昕博士介紹,階躍星辰自研的Step-2 萬億參數(shù)語言大模型采用了創(chuàng)新的 MoE 混合專家模型架構(gòu),在數(shù)理邏輯、編程、知識、指令跟隨等方面體感全面逼近國際主流模型。
在多模態(tài)大模型領(lǐng)域,階躍星辰發(fā)布的 Step-1.5V 千億參數(shù)多模態(tài)大模型,實現(xiàn)了從圖像理解到視頻理解的跨越升級。不僅在圖像感知和理解能力上全面提升,還具備出色的視頻理解能力,能夠準(zhǔn)確地識別視頻中的物體、人物和環(huán)境,甚至理解視頻的整體氛圍與人物情緒。
階躍星辰新發(fā)布的 Step-1X 圖像生成大模型,則代表了階躍星辰在推動多模態(tài)理解和生成統(tǒng)一的技術(shù)路線上取得重要進(jìn)展。據(jù)了解,階躍星辰Step-1X采用全鏈路自研的 DiT(Diffusion Models with transformer)模型架構(gòu),具備更加強(qiáng)大的語義對齊和指令跟隨能力,能夠生成更加符合人類審美和需求的圖像內(nèi)容。和很多開源圖像生成模型不同,階躍星辰Step-1X針對中國元素和中國文化做了深度對齊,使生成作品在中國語境下更具特色。

階躍星辰基于自研萬億參數(shù)大模型和多模態(tài)大模型,進(jìn)一步推動了產(chǎn)品和應(yīng)用的落地。在WAIC現(xiàn)場,階躍星辰綜合調(diào)用的圖像理解、劇情生成、風(fēng)格遷移、圖像生成等大模型能力,聯(lián)合上海電影推出了《大鬧天宮》AI互動體驗,游戲開始,系統(tǒng)會為玩家生成一張《大鬧天宮》畫風(fēng)的形象作為初始平民角色,玩家通過闖關(guān)答題就能實現(xiàn)一場個人化的天宮職場升職記,還會為玩家提供 MBTI 和職業(yè)特征分析。憑借有趣的語言風(fēng)格和出色、可控的生成效果,這款游戲成為WAIC爆火的互動游戲之一。
可以想見,隨著AI技術(shù)的不斷進(jìn)步和圖像生成大模型的持續(xù)發(fā)展,AI技術(shù)在藝術(shù)創(chuàng)作領(lǐng)域的應(yīng)用將進(jìn)入一個新的階段。未來,人們將能夠通過AI技術(shù)更便捷、更高效地實現(xiàn)自己的創(chuàng)意和想法,為藝術(shù)創(chuàng)作帶來更多可能性。