記者7月2日從國家區(qū)塊鏈技術(shù)創(chuàng)新中心獲悉,新華社國家重點實驗室、人民網(wǎng)、中國科學院文獻情報中心、北京廣播電視臺、高等教育出版社、首都圖書館、中央電化教育館出版社、萬方數(shù)據(jù)、中國知網(wǎng)等語料數(shù)據(jù)重點單位,日前聯(lián)合國家區(qū)塊鏈技術(shù)創(chuàng)新中心,共同建立高價值語料可信安全流通生態(tài)體系。
近年來,人工智能技術(shù)快速發(fā)展,為各行業(yè)加速形成新質(zhì)生產(chǎn)力提供了機遇。人工智能大模型的發(fā)展,其訓練使用的高價值語料數(shù)據(jù)是關(guān)鍵因素。當前,高價值語料數(shù)據(jù)跨單位、跨行業(yè)、跨地區(qū)分布,但由于缺乏足夠的隱私安全保障和有效的激勵機制,語料數(shù)據(jù)擁有者往往“不敢分享”“不愿分享”,造成大量高價值語料數(shù)據(jù)“供給難、流通難、使用難”。
國家區(qū)塊鏈技術(shù)創(chuàng)新中心有關(guān)專家表示,以區(qū)塊鏈、隱私計算為代表的新一代信息技術(shù),憑借著可信存證、不可篡改、易確權(quán)、充分保護數(shù)據(jù)隱私安全等優(yōu)異性能,可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,一舉破解上述難題。
據(jù)介紹,此次加入生態(tài)體系的成員均是國內(nèi)語料數(shù)據(jù)領域的核心單位。成員單位將運用我國自主可控、性能領先的區(qū)塊鏈軟硬件一體基礎設施,搭建起覆蓋全國的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實現(xiàn)全國分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質(zhì)量語料數(shù)據(jù)集。同時,成員單位運用區(qū)塊鏈智能合約技術(shù),實現(xiàn)語料數(shù)據(jù)流通全鏈路透明、自動“計量結(jié)算”,激勵語料擁有者分享數(shù)據(jù);運用創(chuàng)新隱私計算技術(shù),保障大模型高價值語料數(shù)據(jù)在處理加工和模型訓練過程中“無法二次傳播”。
此外,生態(tài)體系的共建各方還將開展基于區(qū)塊鏈與隱私計算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài),推動我國人工智能領域通用大模型與行業(yè)大模型的高質(zhì)量發(fā)展。
記者7月2日從國家區(qū)塊鏈技術(shù)創(chuàng)新中心獲悉,新華社國家重點實驗室、人民網(wǎng)、中國科學院文獻情報中心、北京廣播電視臺、高等教育出版社、首都圖書館、中央電化教育館出版社、萬方數(shù)據(jù)、中國知網(wǎng)等語料數(shù)據(jù)重點單位,日前聯(lián)合國家區(qū)塊鏈技術(shù)創(chuàng)新中心,共同建立高價值語料可信安全流通生態(tài)體系。
近年來,人工智能技術(shù)快速發(fā)展,為各行業(yè)加速形成新質(zhì)生產(chǎn)力提供了機遇。人工智能大模型的發(fā)展,其訓練使用的高價值語料數(shù)據(jù)是關(guān)鍵因素。當前,高價值語料數(shù)據(jù)跨單位、跨行業(yè)、跨地區(qū)分布,但由于缺乏足夠的隱私安全保障和有效的激勵機制,語料數(shù)據(jù)擁有者往往“不敢分享”“不愿分享”,造成大量高價值語料數(shù)據(jù)“供給難、流通難、使用難”。
國家區(qū)塊鏈技術(shù)創(chuàng)新中心有關(guān)專家表示,以區(qū)塊鏈、隱私計算為代表的新一代信息技術(shù),憑借著可信存證、不可篡改、易確權(quán)、充分保護數(shù)據(jù)隱私安全等優(yōu)異性能,可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,一舉破解上述難題。
據(jù)介紹,此次加入生態(tài)體系的成員均是國內(nèi)語料數(shù)據(jù)領域的核心單位。成員單位將運用我國自主可控、性能領先的區(qū)塊鏈軟硬件一體基礎設施,搭建起覆蓋全國的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實現(xiàn)全國分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質(zhì)量語料數(shù)據(jù)集。同時,成員單位運用區(qū)塊鏈智能合約技術(shù),實現(xiàn)語料數(shù)據(jù)流通全鏈路透明、自動“計量結(jié)算”,激勵語料擁有者分享數(shù)據(jù);運用創(chuàng)新隱私計算技術(shù),保障大模型高價值語料數(shù)據(jù)在處理加工和模型訓練過程中“無法二次傳播”。
此外,生態(tài)體系的共建各方還將開展基于區(qū)塊鏈與隱私計算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài),推動我國人工智能領域通用大模型與行業(yè)大模型的高質(zhì)量發(fā)展。
本文鏈接:http://www.3ypm.com.cn/news-2-8136-0.html國家區(qū)塊鏈中心牽頭共建人工智能語料共享新模式
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕