2023-04-21 18:43:28 來(lái)源 : 21世紀(jì)經(jīng)濟(jì)報(bào)道
21世紀(jì)經(jīng)濟(jì)報(bào)道記者 王俊 北京報(bào)道
從去年年底到今年年初, ChatGPT火爆全球互聯(lián)網(wǎng), ChatGPT爆火的背后原因是什么?
4月20日舉行的IT市場(chǎng)年會(huì)上,云從科技咨詢規(guī)劃總監(jiān)張俊結(jié)合當(dāng)下的大模型火爆的原因,提出發(fā)展大模型建議的思考。
(資料圖片僅供參考)
張俊建議采取“新型舉國(guó)體制”,由政府統(tǒng)籌通用底層平臺(tái)建設(shè),聯(lián)合AI頭部企業(yè)、科研機(jī)構(gòu)、高等院校等協(xié)同攻關(guān)基礎(chǔ)大模型技術(shù)。大模型研發(fā)需要高門檻的算力、數(shù)據(jù)、人力支持,其具有重要的基礎(chǔ)設(shè)施屬性,建議地方政府統(tǒng)籌規(guī)劃,出臺(tái)相關(guān)扶持政策和科研補(bǔ)貼,政企共建大模型基礎(chǔ)設(shè)施,打通數(shù)據(jù)要素,開(kāi)放應(yīng)用市場(chǎng),加快大模型快速落地并持續(xù)發(fā)展。
從去年年底到今年年初, ChatGPT火爆全球互聯(lián)網(wǎng)。ChatGPT是美國(guó)Open AI基于GPT自然語(yǔ)言開(kāi)發(fā)的聊天程序,底層是基于Open AI在GPT預(yù)訓(xùn)練語(yǔ)言模型迭代生成的程序。GPT-1模型參數(shù)1.17億,GPT-2、GPT-3模型參數(shù)分別為15億、1750億,2023年3月最新發(fā)布的GPT-4參數(shù)數(shù)量是GPT-3的16倍,達(dá)到1.6萬(wàn)億規(guī)模。
張俊指出,ChatGPT的成功證明了人工智能大模型技術(shù)路線的正確性。這意味著人工智能從之前的統(tǒng)計(jì)分類階段走向人類邏輯溝通階段。
AI大模型是經(jīng)過(guò)大規(guī)模訓(xùn)練后能適應(yīng)一系列任務(wù)的人工智能算法模型,是“大數(shù)據(jù)+大算力+強(qiáng)算法”的結(jié)合物,包含了“預(yù)訓(xùn)練”和“大模型”兩層含義。也就是說(shuō)大模型經(jīng)過(guò)大規(guī)模數(shù)據(jù)訓(xùn)練之后,無(wú)需微調(diào)或僅需少量數(shù)據(jù)的微調(diào)就能適應(yīng)千變?nèi)f化的場(chǎng)景。
張俊表示,大模型發(fā)展的歷程,一方面是參數(shù)規(guī)模從億級(jí)到百萬(wàn)億級(jí)突破;另一方面,模態(tài)從NLP自然語(yǔ)言大模型到CV大模型到科學(xué)計(jì)算大模型,逐漸演變到多模態(tài)的大模型融合狀態(tài),更加提高了模型算量的理解能力、應(yīng)用場(chǎng)景的適配能力以及計(jì)算性能。
他提到,大模型相比傳統(tǒng)AI模型有三方面優(yōu)勢(shì)。第一是涌現(xiàn)效應(yīng),大模型能通過(guò)簡(jiǎn)單規(guī)則和相互作用,有效集成自然語(yǔ)音處理等AI核心技術(shù),涌現(xiàn)出強(qiáng)大的智能表現(xiàn),將人工智能的能力從原來(lái)的感知提升至理解、推理,甚至近似人類“無(wú)中生有”的原創(chuàng)能力。
第二是使用場(chǎng)景的廣泛應(yīng)用。張俊表示,AI大模型通過(guò)在海量、多類型的場(chǎng)景數(shù)據(jù)中學(xué)習(xí),能夠總結(jié)不同場(chǎng)景、不同業(yè)務(wù)下的通用能力,擺脫小模型場(chǎng)景碎片化、難以復(fù)用的局限性,為大規(guī)模落地人工智能應(yīng)用提供可能。
第三,研發(fā)效率提高。傳統(tǒng)小模型高度依賴人工標(biāo)注數(shù)據(jù)和人工調(diào)優(yōu)調(diào)參,研發(fā)成本高、周期長(zhǎng)、效率低。大模型將研發(fā)模式升級(jí)為大規(guī)模工廠化范式,采用自監(jiān)督學(xué)習(xí)方法,減少對(duì)人工標(biāo)注數(shù)據(jù)的以來(lái),顯著降低人力成本、提升研發(fā)效率。
張俊提出,大模型具有泛化性和通用性,可以算打通傳統(tǒng)人工智能技術(shù)通用性“任督二脈”的關(guān)鍵;基于“預(yù)訓(xùn)練+精簡(jiǎn)”等新范式有效降低AI開(kāi)發(fā)應(yīng)用門檻;并且大模型以創(chuàng)新的自然語(yǔ)言處理技術(shù),使得人機(jī)交互方式更自然。
“基于多領(lǐng)域的知識(shí),構(gòu)建了統(tǒng)一的、跨場(chǎng)景、多任務(wù)的多模態(tài)大模型已成為人工智能重點(diǎn)的發(fā)展方向。未來(lái)人工智能像供水供電一樣流向終端,流向用戶、流向企業(yè),誰(shuí)能先做到這點(diǎn),誰(shuí)就會(huì)在AI戰(zhàn)局中獲得先機(jī)。”張俊說(shuō)。
云從科技成立于2015年,是第一家在科創(chuàng)板成功上市的人工智能平臺(tái)公司。從2019年發(fā)布CWOS1.0,至今推出了基于大模型的CWOS2.0?!拔覀兊脑竿菢?gòu)建像人一樣思考和工作的人機(jī)協(xié)同的智能體,通過(guò)我們CWOS算法工廠、AI數(shù)據(jù)湖、知識(shí)計(jì)算、人機(jī)交互以及智能業(yè)務(wù)等核心模塊,實(shí)現(xiàn)對(duì)人的感知分析,對(duì)思考和行動(dòng)的全面協(xié)同仿真,形成整個(gè)物理世界的數(shù)字化?!睆埧≌f(shuō)。
基于對(duì)大模型的理解,張俊提出了幾方面建議,第一,在創(chuàng)新體制方面,建議采取“新型舉國(guó)體制”,由政府統(tǒng)籌通用底層平臺(tái)建設(shè),聯(lián)合AI頭部企業(yè)、科研機(jī)構(gòu)、高等院校等協(xié)同攻關(guān)基礎(chǔ)大模型技術(shù)。大模型開(kāi)發(fā)需要很高的門檻,目前國(guó)內(nèi)很多基于ChatGPT的應(yīng)用仍沿用美國(guó)的技術(shù)架構(gòu),但這些并不開(kāi)源,因此要搞開(kāi)源之路,加強(qiáng)數(shù)字監(jiān)管、開(kāi)源開(kāi)放促進(jìn)行業(yè)生態(tài)的發(fā)展應(yīng)用。
第二,賦能產(chǎn)業(yè)發(fā)展,圍繞地方產(chǎn)業(yè)發(fā)展戰(zhàn)略定位,基于大模型攻關(guān)成果,研發(fā)行業(yè)專屬大模型,賦能地方產(chǎn)業(yè)發(fā)展,推動(dòng)地方數(shù)字經(jīng)濟(jì)發(fā)展。
第三,推進(jìn)數(shù)據(jù)共享開(kāi)發(fā)。在智慧城市和數(shù)字化建設(shè)過(guò)程中發(fā)現(xiàn)存在數(shù)據(jù)壁壘和數(shù)據(jù)孤島問(wèn)題,發(fā)展大模型首先要解決數(shù)據(jù)安全高效的共享,包括面向政務(wù)、民生等行業(yè)應(yīng)用場(chǎng)景,挖掘數(shù)據(jù)價(jià)值,將大模型成果應(yīng)用于政務(wù)服務(wù)、城市治理、民生服務(wù)等領(lǐng)域,提高城市管理能力。
第四,創(chuàng)新應(yīng)用,大模型并非一蹴而就,需要通過(guò)不斷積累和不斷迭代產(chǎn)生的效益,讓更多行業(yè)和城市的數(shù)據(jù)接入基礎(chǔ)大模型庫(kù),促進(jìn)大模型應(yīng)用創(chuàng)新。
第五,大模型研發(fā)需要高門檻的算力、數(shù)據(jù)、人力支持,其具有重要的基礎(chǔ)設(shè)施屬性,建議地方政府統(tǒng)籌規(guī)劃,出臺(tái)相關(guān)扶持政策和科研補(bǔ)貼,政企共建大模型基礎(chǔ)設(shè)施,打通數(shù)據(jù)要素,開(kāi)放應(yīng)用市場(chǎng),加快大模型快速落地并持續(xù)發(fā)展。