全球首个藏文智能搜索引擎将于今年八月试运营
中新社西宁3月20日电 (罗云鹏)“‘云藏’作为全球首个藏文智能搜索引擎,目前开发已处于藏文信息录入和分词标注阶段,预计将于2014年8月左右正式上线试运营。”青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛20日告诉中新社记者。
“云藏”一词是藏文的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。
才洛介绍,“云藏”藏文智能搜索引擎以青海湖藏汉文网站为平台进行开发,是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,目前累计投资达1300万元人民币。
自2012年4月“云藏”搜索引擎启动实施至今将近两年的时间里,开发团队曾多次赴北京大学、中央民族大学、西北民族大学等院校,与藏文信息处理方面具有丰富经验的权威专家学者进行研讨,广泛整合藏文核心技术处理方面的信息资源,为项目的实施提供了坚实的基础。
“云藏”搜索引擎研发团队现有工作人员100人,由藏文信息录入组、分词标注组和技术组三个小组构成,团队中藏族比例达84%,相关技术支持由中科院灵玖中科软件(北京)有限公司和北京线点科技有限公司提供。
据海南州藏文信息技术研究中心负责人多杰拉旦透露,“云藏”搜索引擎现已完成主要架构,处于藏文信息录入和分词标注阶段,其中信息录入涵盖藏族天文、历法、医学、经文以及寺院简介等诸多领域,工作量巨大且繁琐。
“相比传统的谷歌藏文搜索模式,‘云藏’引擎建成后不仅能够解决藏文搜索中不能识别语义、词汇打乱导致搜索结果不稳定等问题,而且95%以上的藏文输入正确识别率,更能满足藏文网民个性化的检索需求,使藏文全方位融入互联网世界”多杰拉旦说。
才洛认为:“搜索引擎作为文化与历史传承的新载体,它对一国的文化安全有着相当重要的意义,任何搜索引擎都是有立场、有倾向的,在互联网时代,抓住搜索引擎,就等于抓住了互联网上信息传递的主动权。显然,藏文搜索引擎的建设不但有助于藏语文的保护、传播、使用,也将极大地促进藏族现代文化的发展,更加有利于藏区社会的现代转型。”
另据才洛透露,“云藏”搜索引擎跨苹果iOS和Android系统的藏文转码校译工作已进入准备阶段。(完) (中新网江西新闻转载)