教育部:到2027年初步建成國家關(guān)鍵語料庫

教育部:到2027年初步建成國家關(guān)鍵語料庫

  中新網(wǎng)北京3月31日電(記者 袁秀月)31日,記者從教育部新聞發(fā)布會上獲悉,教育部、國家語委、中央網(wǎng)信辦近日共同印發(fā)《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語言文字信息化發(fā)展的意見》(以下簡稱《意見》)。《意見》提出,到2027年,基本建成國家語言文字大數(shù)據(jù)中心,初步建成國家關(guān)鍵語料庫和國家戰(zhàn)略語言資源信息庫。

  新聞發(fā)布會現(xiàn)場。袁秀月 攝

  到2027年初步建成國家關(guān)鍵語料庫

  《意見》提出,到2027年,國家數(shù)字中文建設(shè)行動取得重要成效,語言文字?jǐn)?shù)據(jù)要素價值有效釋放。基本形成“政府主導(dǎo)、部門協(xié)同、社會參與、共建共享”的語言文字信息化工作機(jī)制;基本建成國家語言文字大數(shù)據(jù)中心,初步建成國家關(guān)鍵語料庫和國家戰(zhàn)略語言資源信息庫;語言文字信息化標(biāo)準(zhǔn)、前沿語言技術(shù)、優(yōu)質(zhì)語言資源、新型語言服務(wù)等基礎(chǔ)支撐能力顯著增強(qiáng)。

  到2035年,中文在全球數(shù)字空間、網(wǎng)絡(luò)空間以及生成式人工智能等關(guān)鍵應(yīng)用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設(shè)、語言文字事業(yè)和經(jīng)濟(jì)社會高質(zhì)量發(fā)展,整體水平位居世界前列。

  推進(jìn)大語言模型等基礎(chǔ)術(shù)語規(guī)范化

  在完善規(guī)范標(biāo)準(zhǔn)方面,《意見》提出,以語言文字信息處理標(biāo)準(zhǔn)建設(shè)為基礎(chǔ),支持面向信息技術(shù)及人工智能領(lǐng)域的語言資源建設(shè)、管理、應(yīng)用、共享標(biāo)準(zhǔn)研究,重點推進(jìn)語料庫、數(shù)據(jù)標(biāo)注、數(shù)據(jù)評價等規(guī)范標(biāo)準(zhǔn)的制修訂。推進(jìn)大語言模型等基礎(chǔ)術(shù)語規(guī)范化。制定手語和盲文的信息化標(biāo)準(zhǔn)。研制民族語言文字信息化標(biāo)準(zhǔn)。研制甲骨文數(shù)字化共享技術(shù)標(biāo)準(zhǔn)。

  在健全資源服務(wù)方面,《意見》提出,加快建設(shè)國家語言文字大數(shù)據(jù)中心,以數(shù)字化技術(shù)動態(tài)監(jiān)測、收集和分析語言文字事業(yè)發(fā)展、國家語言能力建設(shè)、重點規(guī)劃實施、重大工程進(jìn)展等核心業(yè)務(wù)數(shù)據(jù),提高數(shù)據(jù)支持決策效率。以國家語言資源服務(wù)平臺建設(shè)為基礎(chǔ),帶動地方語言資源平臺建設(shè)。推動基礎(chǔ)性語言資源建設(shè),實施國家關(guān)鍵語料庫共建共享計劃,重點支持建設(shè)大規(guī)模中文語料庫及高質(zhì)量民族語言文字語料庫、手語盲文語料庫、行業(yè)領(lǐng)域語料庫、語言監(jiān)測動態(tài)語料庫等。

  重點加強(qiáng)語言文字資源信息安全治理

  在人才培養(yǎng)方面,《意見》提出,依托國家語言文字關(guān)鍵研究領(lǐng)域領(lǐng)航計劃,培養(yǎng)精通語言文字信息化建設(shè)的高層次緊缺急需人才。加強(qiáng)語言人才供需機(jī)制研究,支持高等學(xué)校語言學(xué)科與多學(xué)科深度交叉融合發(fā)展,加強(qiáng)“語言+人工智能”復(fù)合型人才培養(yǎng)。

  在安全保障方面,《意見》提出,重點加強(qiáng)語言文字資源信息安全治理,切實加強(qiáng)數(shù)據(jù)安全、倫理道德、價值觀對齊等重點事項的監(jiān)測與管理,提升資源和技術(shù)的可信性、可控性和可靠性。支持生成式人工智能的語料規(guī)范性、生成內(nèi)容評測評價和全流程追溯機(jī)制研究。加強(qiáng)面向語言資源監(jiān)測的自然語言處理技術(shù)研究,強(qiáng)化語言文字信息安全的態(tài)勢感知、監(jiān)測預(yù)警、風(fēng)險評估和應(yīng)急處置。規(guī)范網(wǎng)絡(luò)空間、數(shù)字空間的語言生態(tài),建設(shè)健康文明的網(wǎng)絡(luò)語言環(huán)境,守住網(wǎng)絡(luò)安全底線。

  打造中國版人工智能教育大模型

  此外,《意見》提出,要實施數(shù)字中文服務(wù)教育發(fā)展行動、數(shù)字中文助力科技創(chuàng)新行動、數(shù)字中文賦能文化傳承行動、數(shù)字中文推動產(chǎn)業(yè)升級行動、數(shù)字中文促進(jìn)社會進(jìn)步行動。

  其中提到,服務(wù)國家教育數(shù)字化戰(zhàn)略行動,加強(qiáng)語言文字信息化建設(shè)成果在國家智慧教育公共服務(wù)平臺和地方智慧教育平臺上推廣共享;助力打造中國版人工智能教育大模型;研究基于大語言模型的教學(xué)新范式,研制大語言模型能力素養(yǎng)框架(師生版)。

  《意見》還指出,加快布局支持一批新型語言文字交叉領(lǐng)域科研機(jī)構(gòu),重點建設(shè)多語言智能化科技創(chuàng)新中心和實驗室。加強(qiáng)古籍?dāng)?shù)字化整理關(guān)鍵技術(shù)研究。推進(jìn)甲骨文數(shù)字化共享。支持研發(fā)面向語言障礙人群、老年群體的科技設(shè)備,鼓勵智能終端設(shè)備的適老化研發(fā)及無障礙改造。(完)

【編輯:劉陽禾】
發(fā)表評論 文明上網(wǎng)理性發(fā)言,請遵守新聞評論服務(wù)協(xié)議
收藏文章
表情删除后不可恢复,是否删除
取消
确定
图片正在上传,请稍后...
评论内容为空!
还没有评论,快来抢沙发吧!
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ©1999-2025 chinanews.com. All Rights Reserved

評論

頂部