專訪全國政協(xié)委員陳松蹊:深度學習和統(tǒng)計分析相結(jié)合,推動人工智能的高效綠色發(fā)展

2024年03月11日 11:53   21世紀經(jīng)濟報道 21財經(jīng)APP   周瀟梟

21世紀經(jīng)濟報道記者 周瀟梟 北京報道 政府工作報告指出,制定支持數(shù)字經(jīng)濟高質(zhì)量發(fā)展政策,積極推進數(shù)字產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)字化,促進數(shù)字技術(shù)和實體經(jīng)濟深度融合。深化大數(shù)據(jù)、人工智能等研發(fā)應用,開展“人工智能+”行動,打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。

全國政協(xié)委員、中國科學院院士、北京大學講席教授陳松蹊今年兩會帶來的提案跟“數(shù)字中國”建設相關(guān),他建議加強數(shù)據(jù)分析人才培養(yǎng)、推進公共數(shù)據(jù)開放,這樣中國才能在全球數(shù)據(jù)賦能競賽中成為“領(lǐng)跑者”,才能更好地推動實現(xiàn)科技自立自強。

近日,21世紀經(jīng)濟報道記者帶著相關(guān)問題專訪了陳松蹊。陳松蹊表示,中國發(fā)展人工智能要走自己的路,可以把深度學習和統(tǒng)計學結(jié)合起來,走一條更效能更綠色的發(fā)展之路。


(全國政協(xié)委員、中國科學院院士、北京大學講席教授陳松蹊,采訪者供圖)

數(shù)據(jù)驅(qū)動經(jīng)濟騰飛有經(jīng)典案例

《21世紀》:今年兩會你帶來的提案,有一份是關(guān)于加強數(shù)據(jù)分析人才培養(yǎng)。在推進人工智能發(fā)展過程中,數(shù)據(jù)起到什么作用?數(shù)據(jù)分析起到什么作用?

陳松蹊:人工智能的算法是基于數(shù)據(jù),基于高質(zhì)量數(shù)據(jù)。人工智能的基礎(chǔ),一個是計算機,一個是統(tǒng)計學。像人工智能大模型,就是基于大量的、無序的、有偏差的數(shù)據(jù),應用統(tǒng)計思想、統(tǒng)計分析方法,構(gòu)建的分析決策模型。

近些年,人力資源部發(fā)布的數(shù)據(jù)顯示,我國數(shù)據(jù)分析人才非常欠缺。大量數(shù)據(jù)要真正實現(xiàn)“賦能”,需要經(jīng)過數(shù)據(jù)分析,因為數(shù)據(jù)存在隨機性、誤差等特征。只有通過分析數(shù)據(jù)才知道其質(zhì)量、價值、是否可以賦能;只有經(jīng)過統(tǒng)計分析才能真正用于決策。

統(tǒng)計學是一門基礎(chǔ)學科,各個學科的實證分析,都需要用到統(tǒng)計學。統(tǒng)計學科數(shù)據(jù)賦能的歷史已有150年,在農(nóng)業(yè)、工業(yè)、生物制藥、醫(yī)學、金融等領(lǐng)域都有廣泛的應用。

日本經(jīng)濟實現(xiàn)騰飛很關(guān)鍵的一環(huán)在于1950年代開始使用統(tǒng)計學的質(zhì)量控制,在數(shù)據(jù)分析的基礎(chǔ)上提升了工業(yè)產(chǎn)品質(zhì)量,是數(shù)據(jù)驅(qū)動經(jīng)濟騰飛的經(jīng)典案例。藥物臨床試驗要做的實證分析,是通過實驗組和對照組來對比驗證藥物是否有效,這里面數(shù)據(jù)的采集分析需要用到統(tǒng)計學方法。美國幾個大的藥廠都雇傭600名統(tǒng)計博士。另外一個數(shù)據(jù)賦能的成功案例是信用卡公司,信用卡個人信用風險評估,就是基于大量個人數(shù)據(jù),應用統(tǒng)計學方法建模分析對不同客戶進行風險打分。近年來,部分統(tǒng)計學畢業(yè)生進入互聯(lián)網(wǎng)公司,跟算法工程師一起完善算法。

我們團隊之前監(jiān)測大氣污染的治理效果,就在考慮統(tǒng)計團隊可以貢獻什么。因為此前評估空氣污染治理效果,主要基于觀測到的大氣污染平均濃度,但是大氣污染受到排放、氣象條件等多因素影響。我們應用統(tǒng)計學方法剔除掉氣象因素,排除掉“天幫忙”的情形,基于排放來監(jiān)測大氣狀況,來評估地方大氣治理的效果,這樣的評估會更加公平有效。

加強統(tǒng)計分析來挖掘數(shù)據(jù)生產(chǎn)力

《21世紀》:我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展多年,但很多大數(shù)據(jù)公司似乎難以盈利,在你看來背后的原因是什么?

陳松蹊:我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有十多年了,此前很多公司側(cè)重在賣硬件,在顯示、存儲、算力等方面投入較多,但是在數(shù)據(jù)分析這塊還比較欠缺。要真正實現(xiàn)數(shù)據(jù)賦能,不能只是配備硬件,需要在某個領(lǐng)域里深耕,真正利用數(shù)據(jù)分析實現(xiàn)科學決策,這樣才能真正盈利。現(xiàn)在要補齊數(shù)據(jù)分析能力,基于行業(yè)特點通過數(shù)據(jù)分析,才能判斷數(shù)據(jù)的質(zhì)量和價值,才能摸索出數(shù)據(jù)賦能的路徑,才能釋放數(shù)據(jù)的生產(chǎn)力。

數(shù)據(jù)賦能現(xiàn)在有兩條路,一條是自上而下,一條是自下而上。“自上而下”就是大模型的應用,使用通用模型來解決問題。但是,大模型耗電量很大,需要使用很多超算,訓練模式也比較復雜,通用大模型下沉到具體企業(yè)還有很長的路要走。對于企業(yè)而言,其實更適合“自下而上”,就是企業(yè)把自己產(chǎn)生的數(shù)據(jù)先分析利用起來,在此基礎(chǔ)上解決企業(yè)、行業(yè)現(xiàn)實的問題。數(shù)據(jù)賦能是一個長期事業(yè),需要企業(yè)有自己的數(shù)據(jù)分析師,而不是只是找短期咨詢師,咨詢完后就走人。

數(shù)據(jù)是國家或企業(yè)的戰(zhàn)略資源,但是數(shù)據(jù)本身不會自動賦能,要通過數(shù)據(jù)分析才能實現(xiàn)。通過數(shù)據(jù)分析挖掘數(shù)據(jù)生產(chǎn)力,是數(shù)字中國建設的一個關(guān)鍵。

統(tǒng)計分析讓人工智能更高效更綠色

《21世紀》:去年美國的ChatGPT,今年開年的Sora,都讓大家驚訝于人工智能的發(fā)展。中國的人工智能應該朝著什么方向努力?

陳松蹊:中國需要走出自己的路,不然總是跟在別人后面。現(xiàn)在大模型主要靠算力,也消耗很多能源,中國可以考慮是否能讓人工智能變得更綠色,比如把深度學習和統(tǒng)計分析結(jié)合起來,在前端做更多聰明的事情,減少一些蠻力投入,這樣對能源的消耗不會那么大,讓人工智能的發(fā)展路徑更加綠色高效。

公共數(shù)據(jù)開放需建立規(guī)范機制

《21世紀》:你今年還有一份提案,建議“加強公共數(shù)據(jù)共享,推動科技數(shù)據(jù)自立自強”。公共數(shù)據(jù)的開放,現(xiàn)在是否變得更迫切?在推動公共數(shù)據(jù)開放共享方面,有何建議?

陳松蹊:數(shù)據(jù)是最新的生產(chǎn)要素,新質(zhì)生產(chǎn)力的發(fā)展往往需要數(shù)據(jù)驅(qū)動。要想數(shù)據(jù)賦能,要想彎道超車,需要有頂層設計,需要在數(shù)據(jù)標準、交易制度、數(shù)據(jù)開放等方面做更多工作。2023年專門成立國家數(shù)據(jù)局,就是為了更好推動相關(guān)基礎(chǔ)工作。

科學家和企業(yè)對公共數(shù)據(jù)都有需求。比如,智慧農(nóng)業(yè)對氣象、地表、土壤等數(shù)據(jù)都有需求。科學家們需要穩(wěn)定的數(shù)據(jù)來源,因為做科研發(fā)表時所用數(shù)據(jù)其他人也要可以獲取,用于重復驗證,因此公共數(shù)據(jù)對外公開的標準和格式都應該有規(guī)范,不要隨意更改。

要推動實現(xiàn)高水平科技自立自強,首先需要提高公共數(shù)據(jù)的開放度。中國科學家可以基于中國海量數(shù)據(jù),構(gòu)建高質(zhì)量的數(shù)據(jù)集,進而推動相關(guān)研究、人工智能往前發(fā)展。

因為國內(nèi)公共數(shù)據(jù)獲取存在困難,我國科學家大量使用國外的公共數(shù)據(jù)進行科學研究。比如英國生物銀行基于30萬大樣本人群的遺傳、生活環(huán)境和健康數(shù)據(jù),是腦科學、生物統(tǒng)計、人口遺傳等學科研究常用的數(shù)據(jù)來源。華為的盤古氣象大模型,是基于歐洲氣象中心的數(shù)據(jù),構(gòu)建了再分析數(shù)據(jù)集,進而訓練成功的。世界衛(wèi)生組織發(fā)布的各國流行病數(shù)據(jù),也是開展相關(guān)研究的重要公共數(shù)據(jù)來源。

在公共數(shù)據(jù)開放方面,政府可以帶個頭。那些不涉及國家安全的數(shù)據(jù),諸如經(jīng)濟、地球科學、交通、氣象等數(shù)據(jù),應該盡可能多地公開共享。建議建立一套公共數(shù)據(jù)公開透明的機制,明確哪些可以對外公開,哪些做了風險評估后公開,哪些需要簽訂保密協(xié)議等。當然,搜集采集數(shù)據(jù)是有成本,有些數(shù)據(jù)的獲取可以收費。

關(guān)注我們

无码av免费毛片观看一区二区,欧美亚洲国产人成aaa,国产精品无码不卡无码不卡,精品视频一区二区三区四区五区
亚洲一线高清精品在线观看 | 亚洲成色在线香蕉 | 在线观看中文字幕码 | 亚洲欧美日韩αv在线电影 亚洲欧美日韩国产一区二区三区精品 | 免费视频综合在线 | 亚洲码欧美码一区二区 |