2023-08-30 05:13:05 來源 : 光明網(wǎng)
AI技術(shù)變革迅猛,2023年大模型已成為全球人工智能發(fā)展的焦點,傳媒行業(yè)更是開啟了大模型技術(shù)創(chuàng)新和應用的新篇章。8月25日,BIRTV2023媒體大模型創(chuàng)新和應用技術(shù)交流會在第三十屆北京國際廣播電影電視展覽會上舉行。人工智能領域的產(chǎn)學研各界代表圍繞“媒體大模型創(chuàng)新應用”展開研討交流,探討如何進一步推動新聞傳媒業(yè)技術(shù)創(chuàng)新和應用。
(資料圖片僅供參考)
傳媒業(yè)成AI主應用陣地
在人工智能等新科技革命浪潮中,全國各地相繼推出大模型扶持政策,傳媒行業(yè)成為AI主應用陣地。
“繼ChatGPT發(fā)布后,國內(nèi)外大模型井噴式爆發(fā),目前已經(jīng)有數(shù)百家發(fā)布大模型的機構(gòu),數(shù)千家依托大模型的應用或公司。”北京中科聞歌科技股份有限公司營銷中心媒體行業(yè)總監(jiān)王禹介紹道,大模型給社會帶來最大的變化是讓知識的獲取和調(diào)用越來越簡單,成本越來越低。
“媒體行業(yè)專屬大模型具備較強的語言理解和文本生成能力?!毙氯A智云資深副總裁張靜介紹說,在國際上,美聯(lián)社、路透社、彭博社、《華盛頓郵報》、《紐約時報》等媒體已經(jīng)將Chat-GPT大模型應用于內(nèi)容采集、數(shù)據(jù)分析、內(nèi)容制作、個性化報道和受眾互動運營等媒體場景中。
由新華社今年5月初步研發(fā)完成,于7月新媒體大會對外發(fā)布的MediaGPT——一個在媒體數(shù)據(jù)上進行訓練的大語言模型,專注于解決中國媒體實際需求。據(jù)新華社技術(shù)局人工智能總監(jiān)、新華社國家重點實驗室人工智能算法高級工程師王仲豪介紹,MediaGPT構(gòu)建了專門適用于媒體領域的獨特數(shù)據(jù)集,并開發(fā)了專門用于生成式任務的驗證方法,以新華社媒體可信數(shù)據(jù)矩陣為大模型基座訓練的規(guī)范化數(shù)據(jù)。
“大模型促進數(shù)字產(chǎn)業(yè)生態(tài)革命性發(fā)展,在供給側(cè)助力AI工業(yè)化發(fā)展進程,在需求側(cè)變革內(nèi)容生產(chǎn)與人機交互方式。”拓爾思副總裁林松濤認為,媒體大模型落地時應注重可信度、可控合規(guī)、安全性及時效性。
“2017年,新華社首次提出機器生產(chǎn)內(nèi)容(MGC)概念?!睆堨o說,新華智云在全國率先探索與實踐。2022年新華智云聯(lián)合新華社技術(shù)局、清華大學、中國人民大學、浙江大學、復旦大學、中國傳媒大學、中國科學院計算技術(shù)研究所等相關(guān)單位,起草了《機器生產(chǎn)內(nèi)容自動化分級標準》,為媒體更有序、更安全地使用AI技術(shù)提供了規(guī)則參考,進一步規(guī)范AIGC在媒體領域的應用。
媒體如何用好專屬大模型
隨著GPT模型的爆火,也引發(fā)了一系列關(guān)于倫理安全的擔憂與AIGC實用價值的質(zhì)疑。同GPT強大的語義理解能力一樣讓人印象深刻的是它總胡言亂語,AI繪圖也因繪圖結(jié)果的不可控,其繪圖過程被戲稱為“煉丹”。
“做新聞領域的專屬大模型,除了技術(shù)投入外,數(shù)據(jù)是關(guān)鍵?!睆堨o認為,對大模型進行訓練和學習所使用的數(shù)據(jù)是有一定要求的,對一般媒體而言,從頭構(gòu)建性價比不太高。
林松濤認為,大模型在媒體垂直領域落地要解決3個問題:一是實現(xiàn)大模型與專業(yè)知識庫的融合;二是如何提升AIGC的內(nèi)容質(zhì)量和數(shù)據(jù)安全,特別是在內(nèi)容事實核查方面;三是如何降低百億級大模型落地的成本。
“新華智云經(jīng)過多年AIGC的應用實踐,總結(jié)AIGC應用創(chuàng)新落地的關(guān)鍵在于約束和場景。”張靜說,有效地約束能更有效地將AI應用于內(nèi)容創(chuàng)作場景,即僅將AI能力作為工程鏈路的一部分,而不完全依賴AIGC。審核環(huán)節(jié)是應用落地的門檻,通過審核來防范惡意內(nèi)容和事實偏差,從應用側(cè)規(guī)避終端用戶的隨意輸入,則能有效把握內(nèi)容的安全輸出。
“MediaGPT生成式大模型是以業(yè)務場景和數(shù)據(jù)驅(qū)動的媒體垂類大模型。”王仲豪分析說,MediaGPT通過特定領域數(shù)據(jù)和專家有監(jiān)督微調(diào)(SFT)數(shù)據(jù)進行訓練,在驗證集上進行人類專家評估和強模型評估,通過大模型調(diào)優(yōu)、安全性評估與糾偏實現(xiàn)價值觀對齊,與各主流模型相較,在各種中文媒體領域任務上表現(xiàn)更優(yōu)。其以新聞垂類海量數(shù)據(jù)、新聞Prompt指令集、RoCE高速網(wǎng)絡、GPU算力集群、向量數(shù)據(jù)庫等為支撐,可實現(xiàn)消息、評論、綜述、快訊等內(nèi)容的自動化生產(chǎn)。
“大模型在媒體行業(yè)落地將面對價值觀對齊、與業(yè)務系統(tǒng)緊密集成、數(shù)據(jù)安全、私有化部署、性價比等諸多挑戰(zhàn)?!绷炙蓾治龅?,做媒體垂直領域落地時要在選好大模型基座的基礎上,在數(shù)據(jù)以及專業(yè)領域有一定的積累。另外,還需要讓用戶知道如何應用,包括真實場景的閉環(huán)、基于用戶反饋的學習等。對媒體而言,通過AIGC賦能數(shù)字人,可實現(xiàn)更深層次的各類“新聞+”服務。如在原有的政務服務鏈接的基礎上,可為用戶提供自然交互,引導用戶如何辦理相關(guān)政務手續(xù),提供智能化政務服務咨詢。
“結(jié)合場景去做應用創(chuàng)新,可以避免AIGC在應用中淪為概念,也能更有效地利用AI的優(yōu)點,規(guī)避AI的缺點。”張靜認為,AIGC可以幫助內(nèi)容創(chuàng)作者實現(xiàn)制作過程更加高效、創(chuàng)意更加豐富、受眾體驗更加友好的目標。
媒體融合技術(shù)發(fā)展進入多語種、跨模態(tài)領域大模型驅(qū)動的融媒體3.0階段,即“媒體+大模型”發(fā)展階段。中科聞歌自主研發(fā)的雅意(YaYi)大模型就是代表之一。
據(jù)王禹介紹,雅意(YaYi)大模型支持實時在線聯(lián)網(wǎng)、離線私有部署、企業(yè)數(shù)據(jù)接入和領域深度分析,可為媒體行業(yè)用戶提供快速構(gòu)建安全可靠的專屬領域大模型應用服務。如結(jié)合選題策劃,通過大數(shù)據(jù)檢索互聯(lián)網(wǎng)上的熱點事件導入大模型進行分析,給出用戶需要的熱點選題,并且自動生成相關(guān)報道。另外,其智能寫作服務平臺可通過AI完成文章大綱自動生成及風格仿寫、AI畫圖與跨模態(tài)審校等。而多模態(tài)內(nèi)容的生成則可以自動生成視頻腳本,結(jié)合AI主播完成視頻制作。
“基于拓爾思在媒體行業(yè)多年的深耕積累,拓天·M大模型在研發(fā)時具有良好的行業(yè)基礎,其在選題策劃、智能生產(chǎn)、傳播分析、服務運營等方面有較強的優(yōu)勢?!绷炙蓾榻B說,拓天大模型面向融媒核心業(yè)務場景專業(yè)適配,可無縫嵌入媒體全鏈條內(nèi)容生產(chǎn)場景中,通過大模型各種能力,與媒體自有數(shù)據(jù)資產(chǎn)進行結(jié)合,進行私有化訓練和工程化部署,不僅保證了媒體的私域數(shù)據(jù)安全,還能確保內(nèi)容生成的準確性。
為采編全鏈條賦能
“現(xiàn)今,AI工程化能力成為商業(yè)應用落地關(guān)鍵?!绷炙蓾治龅?,未來將不再局限于追逐大模型技術(shù)本身,而在于AI深入產(chǎn)業(yè)的進程。大模型在媒體行業(yè)落地將面臨信息失真和錯誤、新聞同質(zhì)化、難以處理復雜的主題和分析、難以理解和表達情感、缺乏人類創(chuàng)造力和思維能力等諸多挑戰(zhàn)。
“未來媒體的‘策、采、編、審、發(fā)、營、評’各個環(huán)節(jié),都可以用AI大數(shù)據(jù)能力去進行賦能,真正使人工智能技術(shù)在媒體融合進程中得以有效應用?!睆堨o展望道,從發(fā)現(xiàn)到生產(chǎn),在AIGC的加持下,媒體可實現(xiàn)“人工定要求、智能秒出稿”的自動化生產(chǎn)。通過AIGC可以實現(xiàn)自動監(jiān)測接入數(shù)據(jù)、挑選有價值素材內(nèi)容、智能識別+自動剪輯+秒級合成、AI自動產(chǎn)出短視頻、人力審核即可發(fā)稿的自動生產(chǎn)場景?!拜斎霐?shù)據(jù)即視頻”“輸入文本即視頻”切實提升了生產(chǎn)效率,通過構(gòu)建數(shù)據(jù)鏈路、設定觸發(fā)規(guī)則、豐富稿件形態(tài)、充分利用挖掘原有文字稿件價值,政策解讀、數(shù)據(jù)新聞可實現(xiàn)秒產(chǎn)大片。而將AIGC廣泛應用于各類賽事、會議會展的互動應用,則可自動生產(chǎn)千人千面與“我”有關(guān)的內(nèi)容,用戶傳播意愿更強。
“面向媒體領域時,基礎大模型可能只能解決使用者40%的問題,但其希望的是解決80%—90%的問題?!绷炙蓾J為,為解決更多的問題,就要在基礎大模型之上,用行業(yè)大模型面向行業(yè)來解決特定場景問題?!笆褂酶哔|(zhì)量數(shù)據(jù)訓練大模型是解決行業(yè)問題最重要的一個手段,或者說實現(xiàn)它的一個價值。”林松濤說。
AIGC讓媒體人體驗到了未來AI行業(yè)應用的無限潛力,但在技術(shù)成果涌現(xiàn)之時,內(nèi)容和數(shù)據(jù)的安全問題也尤為重要。
在政策層面,為了規(guī)避新技術(shù)帶來的陷阱及AIGC或?qū)a(chǎn)生的不良影響,7月,國家網(wǎng)信辦聯(lián)合國家發(fā)展和改革委、教育部、科技部、工業(yè)和信息化部、公安部、國家廣播電視總局發(fā)布《生成式人工智能服務管理暫行辦法》,在明確行業(yè)規(guī)范的同時,也進一步促進了生成式人工智能應用加速落地。
之于網(wǎng)絡安全技術(shù),2023年是AI安全的拐點,大模型應用與擴展威脅情報、智能攻防對抗、風險評估影響等相結(jié)合檢測和減輕網(wǎng)絡威脅,徹底改變了網(wǎng)絡安全問題的處理方式,為媒體行業(yè)的AIGC的應用提供可靠、高效、即時的安全保障。
來源:中國新聞出版廣電報