转自:北京日报客户端
31日,教育部发布《关于加强数字中文建设 推进语言文字信息化发展的意见》,明确我国已建成世界最大的规模语言资源库和中国语言资源知识图谱,集成120多种语言和方言资源。今年,全国语言文字使用情况调查将首次实施。
教育部语言文字信息管理司司长刘培俊介绍,我国已发布100多项国家通用语言文字和民族语言文字信息化规范标准,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础;高水平开展普通话水平测试,实现了测试方式从人工到智能的转变。我国还建成了集成化、智能化、国际化的全球中文学习平台,用户超1600万人,覆盖190多个国家和地区。
今年,全国语言文字使用情况调查将首次实施,打造集数据采集、传输、存储、加工一体的集成化调查平台,为深化教育综合改革和综合国力分析提供大数据支撑。我国还将创新应用自然语言处理、多模态信息处理、知识图谱等5项前沿技术,夯实国家关键语料基础设施建设。
为加快推进语言文字信息化,《意见》提出,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,着力推进中文数字化与数据中文化,完善新型中文服务体系构建与语言文字治理体系。
到2027年,我国将基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制,国家语言文字大数据中心基本建成,初步建成国家关键语料库和国家战略语言资源信息库,前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。到2035年,中文在全球数字空间、网络空间以及生成式人工智能等关键应用场景中的使用占比将显著提高,语言文字信息化整体水平位居世界前列。
来源:北京日报客户端
记者:何蕊
流程编辑:U022