自治区政府新闻办召开蒙古语言
文字数字资源建设与共享工程项目新闻发布会

发布日期:2018-12-28 17:23
分享到:
【字体:  



12月28日,自治区政府新闻办召开蒙古语言文字数字资源建设与共享工程项目新闻发布会。自治区民委党组成员、副主任萨楚日勒图介绍了蒙古语言文字数字资源建设与共享工程项目有关内容,蒙古语言文字研究应用中心研究员梁金宝出席发布会并回答了记者提问。


蒙古语言文字数字资源建设与共享工程项目新闻发布会发布词

自治区民委党组成员、副主任  萨楚日勒图

(2018年12月28日)


各位领导,各位嘉宾,媒体朋友们: 

大家下午好! 

今天,内蒙古自治区民族事务委员会在此隆重举行蒙古语言文字数字资源建设与共享工程项目新闻发布会,我谨代表自治区民委向出席今天活动的各位领导、各位嘉宾和新闻媒体朋友表示热烈的欢迎和诚挚的问候!并借此机会,向关心和支持蒙古语言文字信息化建设工作的各位领导和社会各界朋友表示衷心的感谢! 

40年改革开放,40年锐意进取,内蒙古社会经济发展取得了辉煌的成绩,蒙古语言文字信息化工作也得到了长足发展。近年来,自治区党委、政府高度重视蒙古语言文字信息化工作,出台了《内蒙古自治区人民政府关于加快推进蒙古语言文字信息化建设的意见》和《内蒙古自治区蒙古语言文字信息化建设中长期规划(2014—2020)》,为加快推进蒙古语言文字信息化建设创造了良好的政策环境。2013年,我委启动了蒙古语言文字数字资源建设与共享工程项目立项工作。2014年9月,自治区发改委正式批复立项;2015年11月,自治区发改委批复同意《项目初步设计方案和投资概算报告》。该项目计划3年建成,计划总投资19619万元。2016年11月,项目进入全面建设阶段。

蒙古语言文字数字资源建设与共享工程项目,主要是建设一个以蒙古语言文字为载体,以数字资源开发整合为基础,以信息技术规范化标准化为支撑,以数字资源推广应用为目的的蒙古语言文字数字资源共享平台。项目建设内容包括,信息处理用蒙古文相关标准建设、资源建设的标准规范研究与制定、工程监理、蒙古语言文字数字资源规范统筹及系统集成、资源加工展示与支撑平台建设、应用系统定制开发、数字资源采购与制作等七个部分。其中,项目主体工程应用系统定制开发由中国软件与技术服务股份有限公司负责开发建设,数字资源采购与制作由内蒙古出版集团负责。

该项目建成后,将收集整合民族教育、民族文化、蒙医蒙药、科技等与少数民族干部群众生产生活息息相关的数字化资源,容量可达46TB,以内蒙古为主,覆盖八省区,为学习使用蒙古语言文字的各族干部群众提供更加便捷、更加优质、更加高效的公共服务。

目前,已经制定了《传统蒙古文名义字符到变形显现字符的转换补充规则》、《蒙古文数字对象唯一标识符规范》等26项信息技术标准和数字资源加工规范项目标准,并在50多个蒙古语言文字信息化建设项目中得到推广实施。项目建设方面,现已完成蒙古语言文字搜索引擎“智路搜索”开发建设和“蒙古语资源网”应用系统开发,数字资源采购与制作正在加紧建设,预计2019年上线运行。

下面,我重点给大家介绍一下“智路搜索”这个蒙古语言文字搜索引擎。

现如今云计算、人工智能、大数据等已成为信息社会的重要生产力。在这些新兴技术的作用下,互联网上每天都会产生大量的信息数据。而搜索引擎系统是在这庞大的海量数据里能够准确定位自己想要的信息的重要手段,也是越来越多的网民定位资源、获取资源的重要途径。如百度、谷歌等搜索引擎网站。由于蒙古语言文字信息处理技术发展较晚,现在还没有比较好用蒙古文搜索引擎系统。共享工程开发建设智路搜索引擎系统,将会大大简化广大用户在互联网上获取蒙古文信息的过程。目前,我们已经搜集整理了包括蒙古语新闻网、新华网蒙古文、内蒙古政府蒙古文网站群等在内的200多个蒙古文网站、40多万蒙古文网页。

实施蒙古语言文字数字资源建设与共享工程项目是我委认真落实自治区党委、政府工作部署的具体举措,也是增进民族团结、弘扬民族文化的重大民生工程。做好这个项目,需要社会各界的关注参与,希望大家能够一如既往地关心蒙古语言文字信息化建设工作,与我们一道,共同建设好蒙古语言文字数字资源建设与共享工程项目,着力为推进全区经济社会持续健康发展提供强有力的智力支持,努力为扎实推进民族团结、打造祖国北疆亮丽风景线做出积极贡献。

最后,祝大家身体健康、工作顺利、家庭幸福。

谢谢! 



蒙古语言文字数字资源建设与共享工程项目新闻发布会答记者问


内蒙古日报社记者:蒙古文搜索引擎会给网络用户带来哪些便利?她具有哪些技术特点和功能特色?

梁金宝:现在互联网上每天都会产生大量的信息数据,并且大部分都以网页形式展现给用户。通常情况下,在这样庞大的海量数据里能够准确定位自己想要的信息是非常困难的。比如在互联网上你想找到自己想看的中文网页,那么最便捷的方法是通过搜索引擎,比如百度网。目前市面上还没有功能强大而好用的蒙古文搜索引擎。而我们开发的这个蒙古文搜索引擎,将会给广大网络用户提供功能强大、使用便利的互联网搜索服务。

关于我们蒙古文搜索引擎的功能特色,蒙古文在互联网上传播和使用时,由于蒙古语言文字本身特点引起的“同形异码”问题是比较普遍的,尤其在检索信息时尤为明显。为了解决这个问题我们在搜索引擎里开发了“按字形检索”、“忽略控制字符检索”、“圆唇元音模糊检索”、“按词根检索”等方便的、具有针对性的检索功能。通过这些便捷的辅助功能,能够更加简化找到自己想要网页的过程。同时我们的搜索引擎也提供除了网页搜索以外的图片搜索、音频搜索、文档搜索、新闻搜索多个专业领域搜索服务。


新华社记者:目前通过蒙古文搜索引擎能够搜索到哪些蒙古文网站的内容?

梁金宝:在互联网上,蒙古文网站数量不像其它大语种网站数量那么多。如果我们在百度上随便搜索任意一个单词,几乎会搜到大几千万条的搜索结果。而目前,在互联网上能够正常访问的蒙古文网站只有二百多个,这里包括大家经常使用的蒙古语新闻网、新华网蒙古文网、内蒙古政府蒙古文网站群、内蒙古电视台蒙古文网、人民网蒙古文版等等。这些网站里能够被访问的网页总数有四十多万个。通过我们的搜索引擎能够在这些网页里精确搜索到自己想要的网页内容。另外,除了能够在这些网站里搜索到蒙古文网页以外,还可以通过我们的搜索引擎搜索到保存在上述蒙古文网站上的图片、音乐、文档等多媒体信息。


内蒙古广播电视台记者:目前蒙古文搜索引擎存在哪些问题?你们下一步工作计划是什么?

梁金宝:由于蒙古文信息处理相关标准制定比较晚,所以多年来在互联网上也沉积了一些未按国家标准编码的蒙古文网络内容。对这些未按国家标准编码的网页进行跨编码检索的时候,搜索结果并不那么理想。比如存在一些不同编码体系的网页内容还无法被检索到。

关于下一步工作,我们主要以如下两个方向努力:

1.新发布的智路搜索引擎在充分支持执行蒙古文编码国家标准体系的蒙古文网络内容的同时,兼顾由于历史、技术等原因而产生的非国家标准编码的内容,通过技术手段进一步提高搜索覆盖面和准确度,从而为广大用户提供更加便捷、高效的互联网检索服务。

2.在经过一段时间的试运行后,我们还会根据广大用户的使用体会和意见反馈,继续优化搜索引擎的用户体验感和检索性能,不断满足大家的各方面的需求。

 


信息来源: 内蒙古自治区民族事务委员会

轮播图预览:
您还未登录,请登录后进行收藏!

是否“确认”跳转到登录页?