- 一句話定制聲音,訊飛星火大模型更智能更人性化
- 2024年05月27日來源:南方企業(yè)新聞網(wǎng)
提要:近日,訊飛星火大模型V3.5春季重磅更新,作為業(yè)內(nèi)首創(chuàng)的長文本、圖文、語音一體化處理模型,能夠迅速吸收海量信息,為各行業(yè)提供精準(zhǔn)解答。新升級(jí)的星火語音大模型,擁有多情感超擬人合成技術(shù),可以展現(xiàn)豐富情緒,并具備聲音復(fù)刻功能,更富人性溫度。同時(shí),面向企業(yè)應(yīng)用場景,科大訊飛推出星火智能體平臺(tái),幫助企業(yè)解決大模型落地的最后一公里難題。
近日,訊飛星火大模型V3.5春季重磅更新,作為業(yè)內(nèi)首創(chuàng)的長文本、圖文、語音一體化處理模型,能夠迅速吸收海量信息,為各行業(yè)提供精準(zhǔn)解答。新升級(jí)的星火語音大模型,擁有多情感超擬人合成技術(shù),可以展現(xiàn)豐富情緒,并具備聲音復(fù)刻功能,更富人性溫度。同時(shí),面向企業(yè)應(yīng)用場景,科大訊飛推出星火智能體平臺(tái),幫助企業(yè)解決大模型落地的最后一公里難題。
據(jù)科大訊飛董事長劉慶峰透露,科大訊飛將在6月27日發(fā)布訊飛星火大模型V4.0,進(jìn)一步解放生產(chǎn)力、釋放想象力。
助力知識(shí)高效獲取
為什么要做長文本、長圖文、長語音的大模型?
通過訊飛星火App可以看到,用戶使用的最高峰不是周末,而是工作日的上午9時(shí)30分和下午3時(shí)30分。這意味著,大部分用戶用訊飛星火來解決和工作相關(guān)的剛需問題。而高效的知識(shí)獲取是用戶和開發(fā)者都高度關(guān)注的問題。
經(jīng)過分析發(fā)現(xiàn),在知識(shí)獲取和學(xué)習(xí)的過程中,廣大用戶能拿到的資料往往不僅是現(xiàn)成的長文本,還有隨手可見的報(bào)刊書籍內(nèi)容、各種研討會(huì)的PPT內(nèi)容,老師黑板上的板書、同學(xué)的筆記,以及各種會(huì)議錄音、訪談,各種網(wǎng)上的發(fā)布會(huì)、培訓(xùn)教育視頻等,能不能把這些文本、圖片、語音等都上傳到訊飛星火中,快速地獲取知識(shí)?
為此,科大訊飛推出首個(gè)支持長文本、長圖文、長語音的大模型,來解決用戶真實(shí)場景中多源信息的獲取需求。
這次訊飛星火長文本功能全新升級(jí)后,具備長文檔信息抽取、長文檔知識(shí)問答、長文檔歸納總結(jié)、長文檔文本生成等能力,總體已經(jīng)達(dá)到GPT-4 Turbo 4月最新長文本版本的97%水平,而在銀行、保險(xiǎn)、汽車、電力等多個(gè)垂直領(lǐng)域的知識(shí)問答任務(wù)上,訊飛星火長文本總體水平已經(jīng)超過GPT-4 Turbo。
科大訊飛董事長劉慶峰透露,為了解決大模型應(yīng)用效率和準(zhǔn)確率問題,科大訊飛進(jìn)行了重要的模型剪枝和蒸餾,從而推出業(yè)界性能最優(yōu)的130億參數(shù)的大模型,在效果損失僅3%以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識(shí)問答的首響時(shí)間以及文字生成方面都獲得了極大的效率提升。測試顯示,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本,星火大模型的性能都做到業(yè)界最優(yōu)。
此外,面向復(fù)雜的圖文場景,科大訊飛在圖文識(shí)別、公式識(shí)別大賽多年國際第一的技術(shù)積累基礎(chǔ)上,首次推出星火圖文識(shí)別大模型。
相比傳統(tǒng)小模型逐行文字識(shí)別的限制,星火圖文識(shí)別大模型具有三大優(yōu)勢:能夠直接處理非常復(fù)雜的版面分析,目前已經(jīng)覆蓋31個(gè)典型場景,同時(shí)能自動(dòng)識(shí)別標(biāo)注出18類不同的版面要素;融合篇章上下文語義進(jìn)行文字識(shí)別,識(shí)別更精準(zhǔn);面向教育、金融、醫(yī)療、科研等專業(yè)領(lǐng)域深度優(yōu)化,能自動(dòng)實(shí)現(xiàn)更多領(lǐng)域的專業(yè)符號(hào)識(shí)別。
以技術(shù)進(jìn)步解決真實(shí)剛需
記者獲悉,訊飛星火長文本、長圖文、長語音能力的升級(jí),進(jìn)一步推動(dòng)大模型在各個(gè)場景的落地。
在招投標(biāo)場景,此前憑借訊飛星火出色的文本理解、邏輯推理和數(shù)學(xué)能力,科大訊飛和國家能源物資公司在企業(yè)采購場景合作了智能無人評(píng)審系統(tǒng),在國家能源集團(tuán)已評(píng)審5.7萬余單,評(píng)審準(zhǔn)確率達(dá)97%。這一次,疊加本次升級(jí)的長文本和長圖文能力,可以讓評(píng)標(biāo)更便捷、更高效、更準(zhǔn)確。
日常生活中,人們在買賣商品、裝修房屋或者是購買汽車保險(xiǎn)時(shí)經(jīng)常會(huì)遇到各種各樣的合同,看不懂存在風(fēng)險(xiǎn)怎么辦?科大訊飛推出星火合同助手,它可以對(duì)我們的合同進(jìn)行風(fēng)險(xiǎn)審核、合同比對(duì),摘要總結(jié)以及合同生成,迅速識(shí)別潛在風(fēng)險(xiǎn)漏洞,成為你口袋里的“法務(wù)助手”。
在教育場景,科大訊飛進(jìn)一步升級(jí)了訊飛AI學(xué)習(xí)機(jī)產(chǎn)品,不僅對(duì)作文的批改和理科題目的批改更加精準(zhǔn),也讓智能化輔學(xué)更有針對(duì)性更高效;也結(jié)合本次多模態(tài)能力升級(jí)了百科問答功能,星火大模型理解并融合了大量圖書知識(shí),對(duì)于孩子的奇思妙問等復(fù)雜問題,“愛因斯坦”和他的大咖虛擬人朋友都能回答,讓孩子們在趣味互動(dòng)中學(xué)知識(shí)、長見識(shí),同時(shí)提升了孩子主動(dòng)提問的意愿和能力。
此外,星火科研助手目前已在中國科學(xué)院、三亞崖州灣科技城、北京郵電大學(xué)、哈爾濱工業(yè)大學(xué)等機(jī)構(gòu)高校鋪開應(yīng)用。多模態(tài)能力升級(jí)下,訊飛星火科研助手也進(jìn)一步提升了論文問答、綜述生成、實(shí)驗(yàn)解讀等的效果,使得解析的學(xué)術(shù)資料更加豐富,進(jìn)一步賦能高校和科研院所的科研工作。
能“情感共鳴”,還能“一句話聲音復(fù)刻”
萬物互聯(lián)時(shí)代,需要更真實(shí)的AI語音交互。年初訊飛星火V3.5發(fā)布會(huì)上,科大訊飛推出了超擬人對(duì)話功能,AI的聲音更自然更真實(shí),擬人度達(dá)到了83%,受到用戶的廣泛歡迎。
此次科大訊飛發(fā)布多情感超擬人合成,進(jìn)一步提升了情緒表達(dá)的可感知度,對(duì)高興、抱歉、安慰、撒嬌、困惑等情緒表達(dá)的可感知度達(dá)到85%以上,AI語音的生動(dòng)、真實(shí)性再度提升。
除了超擬人對(duì)話,科大訊飛還推出“一句話聲音復(fù)刻”功能,一句話就可以定制你的AI助手聲音。比如模仿小朋友的聲音,每天給爺爺奶奶讀書讀報(bào);在我們出差的時(shí)候,模仿我們的聲音給孩子講故事。這個(gè)功能可以讓世界變得更有溫度。
科大訊飛的這一系列升級(jí),無疑將AI技術(shù)的應(yīng)用推向了新的高度。從文本到語音,從日常應(yīng)用到專業(yè)領(lǐng)域,科大訊飛的星火大模型V3.5以及即將發(fā)布的V4.0,都在不斷突破技術(shù)的邊界,為人們的生活、工作和學(xué)習(xí)帶來前所未有的便利。而這一切的背后,是科大訊飛對(duì)于技術(shù)創(chuàng)新和用戶需求的深度理解和不懈追求。未來,科大訊飛將繼續(xù)引領(lǐng)AI技術(shù)的發(fā)展,推動(dòng)人工智能與各行各業(yè)的深度融合,讓AI真正成為人們生活工作中的得力助手。