当前位置:首页  浙大报道  学术  科研

在数据海中捞“大鱼”

中国工程科技知识中心完成总体技术构架

发布时间:2013-04-11来源:浙大新闻办作者:周炜 张鸯4854


    鼠标一点,就相当于跑了好几个图书馆、档案馆,查阅了许多个专业数据库,搜寻了浩如烟海的工程技术报告和专利库——这样“坐享其成”的好事,正是中国工程科技知识中心的建设愿景。浙江大学计算机学院的科研团队作为主要力量参与了中心的建设,经过一年的研发,目前已经完成了总体技术构架,并形成了中草药、金属材料、工程科技图书、工程咨询报告等
4个专业知识服务系统。
    
    
据介绍,知识中心于20123月启动,计划用9年左右的时间,汇聚打通我国工程科技领域海量数据,构建工程科技领域各个专业知识服务系统,建成国内工程科技信息资源最丰富,应用范围最广,实用性最强的知识整合体。
    
    
让分散的数据汇聚成海,并形成便于获取和生成新知识的数据库,是知识中心最核心的技术路径。知识中心技术总体组组长、浙大计算机学院院长庄越挺说,目前互联网上的搜索引擎只实现了网页搜索功能,只能搜索到数据海中的浅表信息,还远远不能满足工程科技“深度搜索”的需求。比如,想要研究钢铁材料,在搜索引擎中得到的信息大多只是钢铁的商业信息,而关于钢铁生产的技术参数,钢材本身的材料韧度、强度、耐火性等数据,在互联网搜索结果中几乎找不到,必须去查找专业的数据库。
    
    
知识中心是要通过技术创新,让更海量的知识,更容易地被获取。“我们一项重要的工作是对知识数据的二次智能加工,将书本、网络、数据库等来源的信息进一步‘碎片化’。比如一本书可以按照章节、段落来存储。这样的一个好处是,比如当你寻找一个名词概念时,不同的学者有不同的定义,就很方便地把所有对这个概念的描述找出来,放在一起一目了然。”
    
    
在中草药专业知识服务系统中,记者尝试在通用搜索选择“单味药”输入“麻黄”后,麻黄的性味,功效,用法用量,医药案例等信息一一展现。在相似药分析服务中,可以看到8000多味中药中与“麻黄”药物属性相似的药材,点击连线,系统列出“麻黄”与“防风”之间在药物属性以及化合物方面的异同。在配伍分析服务中,输入“麻黄”,系统动态生成它与其他药材的配伍图。“这有助辅助科研人员更快捷有效地进行药物筛选、新药发现等研究工作。”庄越挺说。
    
    
“中国工程科技知识中心的建设正当其时,云计算在方法论上解决了技术路径的可行性,另外近年中国工程科技的高速发展,积累了大量的工程科技的数据,正需要这样的数据库共享资源。广大的工程科技人员也迫切需要新型的工具,以便在大数据中发现新知识,新规律。”中国工程院主席团名誉主席徐匡迪在知识中心建设调研时说。“高铁、杭州湾跨海大桥、三峡大坝等中国大型的工程积累了丰富的经验,很多技术数据可以积累下来,让更多的人共享。”
    
    
据了解,目前四个专业知识服务系统已进入测试阶段,接下去将逐步展开50-60个专业知识服务系统的建设。
    
    (文 周炜/张鸯)