正在加載數(shù)據(jù)...
        1. 高端制造|生態(tài)環(huán)保|汽車|房地產(chǎn)|家居建材|家電|服裝|時尚前沿|健康|醫(yī)藥|教育培訓(xùn)|能源化工|文旅

          航旅交運(yùn)|食品飲品|科技|互聯(lián)網(wǎng)|手機(jī)通信|電子|商業(yè)|金融保險|證券|安防|人工智能|鄉(xiāng)村振興|綜合

        2. 當(dāng)前位置:南方企業(yè)新聞網(wǎng)>要聞> 人工智能>正文內(nèi)容
          • 自然人機(jī)交互邁出重要步伐
          • 2024年05月19日來源:經(jīng)濟(jì)日報

          提要:接入GPT-4o的ChatGPT語音助手,能和用戶實時對話且從語音中分辨用戶是否緊張,能通過前置攝像頭觀察用戶的面部表情并分析其情緒變化,能當(dāng)家教老師在線教孩子解數(shù)學(xué)題……能聽、能看、能說,且達(dá)到人類級別的響應(yīng)時間和表達(dá)能力,難怪不少網(wǎng)友驚呼:大模型從“呆瓜”變“真人”了!

          近日,美國人工智能公司OpenAI在其春季發(fā)布會上展示了新一代旗艦生成模型GPT-4o。接入GPT-4o的ChatGPT語音助手,能和用戶實時對話且從語音中分辨用戶是否緊張,能通過前置攝像頭觀察用戶的面部表情并分析其情緒變化,能當(dāng)家教老師在線教孩子解數(shù)學(xué)題……能聽、能看、能說,且達(dá)到人類級別的響應(yīng)時間和表達(dá)能力,難怪不少網(wǎng)友驚呼:大模型從“呆瓜”變“真人”了!

          作為人工智能大模型浪潮的領(lǐng)航者,OpenAI這次發(fā)布展現(xiàn)了人工智能大模型2個新趨勢。

          一方面,大模型向應(yīng)用端需求進(jìn)化,商業(yè)價值更加凸顯。

          在GPT-4o之前,用戶以語音模式與ChatGPT對話,要通過音頻轉(zhuǎn)文本、文本處理、文本轉(zhuǎn)音頻3個模型來實現(xiàn),平均延遲為2.8秒(GPT-3.5)和5.4秒(GPT-4)。GPT-4o是OpenAI的首個“端到端多模態(tài)大模型”,“o”代表omni,即“全能”的意思。它用一個模型同時處理文本、視覺和音頻的輸入輸出,所有輸入和輸出都由同一個神經(jīng)網(wǎng)絡(luò)完成,這讓它的反應(yīng)速度有了質(zhì)的提升。GPT-4o可以在短至232毫秒、平均320毫秒的時間內(nèi)響應(yīng)音頻輸入,與人類在對話中的反應(yīng)速度一致。這意味著高端人工智能產(chǎn)品更接近一個自然人,向自然人機(jī)交互邁出了重要一步。

          GPT-4o在資源消耗和響應(yīng)速度上進(jìn)行了優(yōu)化,達(dá)到了與GPT-4 Turbo相當(dāng)?shù)哪芰Γ医档?0%的推理成本,打開了商業(yè)推廣的空間,更有利于在智能手機(jī)、智能電腦等個人終端上實現(xiàn)端側(cè)應(yīng)用。在消費終端,用戶需求多樣化且變化迅速,需要提升交互界面的友好性和易用性,讓用戶獲得流暢、自然的交互體驗。GPT-4o向具備情緒價值和自然交互能力的方向進(jìn)化,意味著大模型在端側(cè)的落地更進(jìn)一步,有望開啟下一波科技應(yīng)用和商業(yè)模式的革命,出現(xiàn)人工智能的國民級應(yīng)用。

          另一方面,大模型技術(shù)迭代放緩,風(fēng)險和不確定性增加。

          OpenAI并沒有推出萬眾期待的GPT-5,這讓不少業(yè)內(nèi)人士推測,OpenAI“用更多大數(shù)據(jù)煉更大模型”這條技術(shù)迭代路線可能已遇到瓶頸,國內(nèi)底層大模型加速追趕的窗口期或許到了。人們還期待GPT-5解決當(dāng)代大模型存在的最大問題——幻覺(胡編亂造),因為它影響大模型的可靠性。這個問題也沒能在GPT-4o中獲得解決。有些網(wǎng)友就在試用中發(fā)現(xiàn)它會認(rèn)字不會寫字,如果讓它輸出一張含有特定文字內(nèi)容的手寫字體圖畫,它會寫出誰都看不懂的自造字。此外,OpenAI去年發(fā)布的GPT-4模型僅限付費用戶使用,今年則宣布新模型GPT-4o用戶不用注冊、功能全部免費。OpenAI開始卷起了免費,可能是GPT的用戶增長和收入增長都已經(jīng)碰到瓶頸。

          從卷參數(shù)、卷文本長度再到卷多模態(tài),大模型的競爭一直很激烈。隨著當(dāng)前人工智能技術(shù)的快速發(fā)展,大模型技術(shù)路徑和商業(yè)模式的多樣性和不確定性增加,商業(yè)投資風(fēng)險也隨之增加。對國產(chǎn)大模型來說,風(fēng)險也是機(jī)遇。比如,全球首個三模態(tài)大模型其實是2021年7月中國發(fā)布的“紫東太初”。不管大模型賽道往什么方向去,中國都有基礎(chǔ),也應(yīng)該有信心打開更廣闊的應(yīng)用商業(yè)化空間。



          版權(quán)及免責(zé)聲明:
          1. 任何單位或個人認(rèn)為南方企業(yè)新聞網(wǎng)的內(nèi)容可能涉嫌侵犯其合法權(quán)益,應(yīng)及時向南方企業(yè)新聞網(wǎng)書面反饋,并提供相關(guān)證明材料和理由,本網(wǎng)站在收到上述文件并審核后,會采取相應(yīng)處理措施。
          2. 南方企業(yè)新聞網(wǎng)對于任何包含、經(jīng)由鏈接、下載或其它途徑所獲得的有關(guān)本網(wǎng)站的任何內(nèi)容、信息或廣告,不聲明或保證其正確性或可靠性。用戶自行承擔(dān)使用本網(wǎng)站的風(fēng)險。
          3. 如因版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在文章刊發(fā)后30日內(nèi)進(jìn)行。聯(lián)系電話:01083834755 郵箱:news@senn.com.cn

          責(zé)任編輯:張?zhí)K婧
          相關(guān)新聞更多
            沒有關(guān)鍵字相關(guān)信息!
          文章排行榜
          官方微博