近年来,知识图谱理论、技术和产品发展迅速,正在成为大数据管理、数据分析和价值挖掘的重要支撑。为进一步促进知识图谱产学研交流,推动知识图谱相关标准研究制定、加快大数据与知识图谱技术融合应用,年12月21日下午,大数据发展促进委员会(以下简称“数促会”)在北京召开“大数据与知识图谱技术研讨会”。
会议由中国信息通信研究院云计算与大数据研究所大数据部主任、大数据发展促进委员会常务副主任魏凯主持。会议邀请了知识图谱主要研究机构、技术及服务提供商和应用单位的专家,共同探讨知识图谱技术工具发展与相关标准。与会代表共计50余人。
首先,数促会技术与产品工作组组长姜春宇介绍数促会大数据工作进展,描绘了数促会整体工作架构和标准体系,简要介绍了本年度重要知识成果。他以《行业知识图谱构建》为题,阐述了知识图谱的技术组成、发展情况,并梳理了知识图谱行业普及所带来的挑战,他预测未来,每个行业、企业都会形成自己的知识图谱库。最后,姜春宇预告了18年4月中旬大数据产业峰会的筹备计划。
百度公司知识图谱部主任架构师詹毅开展了《从数据到知识——百度知识图谱技术及应用》的演讲,他首先简单介绍了百度人工智能技术布局,并举例生动形象的讲解知识图谱的核心价值,技术意义、知识图谱的数据内容和全流程架构。接下来,他深度介绍了知识抽取、实体归一、知识解析、知识计算与推理、知识图谱检索、知识图谱问答等知识图谱的关键技术。然后他简单讲解了百度知识图谱的四类应用,包括智能搜索、信息流、对话系统、汉语知识图谱等。最后,詹毅抛出了新的资源形式,新的知识类型,新的覆盖范围的思路构想。
腾讯公司高级工程师杨韬以《腾讯知识图谱介绍》为题开展了知识图谱的讲解,他主要介绍了腾讯专注于通用领域的知识图谱TopBase的总体架构、技术模块、数据情况和相关应用,简要介绍了公司内部其他团队在做的垂直类知识图谱,比如游戏、动漫等。杨韬表示TopBase的架构流程是数据获取→基础构建→补充构建→对外API→服务产品,并详细阐述了每步流程的重要技术构成,他强调数据清洗在知识图谱中占据大量工作比重,最后,杨韬简单介绍了SPO查询、知识问答、相关实体推荐、实体链接等知识图谱技术支撑的应用内容。
搜狗公司搜索事业部总监刘明荣讲解《知识图谱助力智能信息获取》,他首先强调搜狗公司“自然交互+知识计算”的AI人工智能理念,然后详细介绍了基于知识图谱的智能问答(KB-QA)技术路线,其智能问答架构包括知识库构建系统和基于知识库的问答系统,两个系统都涉及具体的技术步骤,其中知识库问答主要处理步骤有五步,即预处理、查询意图分析、候选三元组检索、排序消岐推理以及结构化展示。最后,刘明荣展示了搜狗跟卫计委权威医学科普网站战略合作构建的医学知识图谱案例。
明略数据技术合伙人孟嘉的演讲题目是《知识图谱技术的行业应用与实践》,他首先表明明略认为知识图谱旨在通过建立数据之间的关联链接,将碎片化的数据有机的组织起来,感知智能与认知智能,为人工智能提供知识库基础。在目标的牵引下,明略筹建了知识图谱的产品体系,包括数据、知识工场、知识图谱数据库、行业大脑以及新一代交互等。然后孟嘉在简要介绍了NEST知识图谱存储与计算之后,讲解了明略自研的“小明Litemind”对话机器人框架以及基于“小明”的问答方案,最后简单介绍了基于知识图谱的可视化数据分析平台SCOOPA以及知识图谱在公共安全领域、金融领域的一些实践和设想。
中软国际大数据战略研究室主任符山的演讲题目是《后大数据时代知识图谱的定位和应用语境思考》,符山按照后大数据时代的焦点、知识图谱的技术本质以及行业应用语境和实践三部分内容梳理了他对“知识图谱”的见解,他认为后大数据时代,信息技术届的三大网红包括人工智能、区块链和知识图谱,知识图谱处于未来战略性技术的基础和共性位置。知识图谱的本质是结构化的、网状的新一代语义知识库,也是人工智能的“新”领域,他正从通用搜索扩展到多行业应用。在垂直行业语境下,知识图谱的应用多集中在三类场景即交互力提升、流程自动化和分析洞察。最后,他简单讲解了知识图谱在保险行业、证券行业、股票交易、智慧警务的一些应用案例。
北京文因互联科技有限公司CTO张强在《金融知识图谱的探索与实践》报告中聚焦金融领域阐述“知识图谱”,他先将知识图谱拆解成知识存储、知识提取、知识检索和知识表现四个部分,并强调数据的质量上升层次有:脏数据→干净数据→图谱数据→业务逻辑→“魔术”等,数据每上升一个质量层次都需要消耗成本。针对“成本-收益”,文因将知识项目分成“‘重’的知识项目”和“‘轻’的知识项目”。接下来,张强阐述了文因数据提取框架图,并详细介绍了财务数据提取、公告摘要提取内容。最后简介了个性化报告生成、隐含关系发现、基于图谱的问答等图谱应用。
厦门渊亭信息科技有限公司创始人洪万福向大家介绍了《基于知识图谱的通用认知计算平台》,洪万福主要介绍了行业图谱构建工具“DataExa-Sati”的产品思路、产品模块、产品特性以及其涉及的图计算引擎、知识计算推理引擎、图谱综合分析平台、图谱可视化引擎以及图谱二次开发SDK。它强调“DataExa-Sati”适用各个行业,重点满足安全、运营商、金融等的数据智能需求。并在最后展示了利用“DataExa-Sati”工具梳理的公安反恐情报图谱、金融信贷流程全景知识图谱、精准医学图谱、投资生态图谱、影视情节人物图谱等应用。
智言科技创始人周柳阳分享了题目为《领域知识图谱的应用和探索》的报告内容,首先他举例抛出了两个问题,一是如何去判断知识图谱的准确度和覆盖率,二是如何构建知识图谱的动态优化思路。然后,他详细剖析了基于知识图谱的问答系统的架构、问答流程以及算法匹配方案,并简要介绍了“保险条款”知识图谱案例及其衍生出来的知识图谱的“增删改查”问题和解决方案。最后,介绍了“问答系统”产生的比较有趣的实际例子,显示出WeBot机器人基于深度语义匹配技术结合知识图谱的推理功能。
自由讨论时,各与会代表就知识图谱的应用和实践进行了热烈的讨论和交流。
最后,魏凯主任做了精彩总结,并介绍了数促会在知识图谱方面的后续工作计划。接下来,数促会将在构建知识图谱通用方法论、梳理评价指标、构建知识图谱产品标准、汇总企业实践情况、构建国内知识图谱大赛等方面发力。
参与此次研讨会的还有来自中科院、农业银行、北京银行、石化盈科、华为、中兴、中国电信、、北航、国电通、四方伟业、华瑞新智、星环、清华同衡、广东联合电服、海致网聚、数梦工场、昆仑数据、蓝海健康云智、南大通用、清律律师事务所、上海合合、施耐德、数洋智慧、唯得睿、太一云、东方金信、中国网安、诸葛千策等机构的专家。
欢迎更多企业和行业深度参与数促会关于“知识图谱”的后续工作。
精彩内容回顾
数据中心联盟年全体会员大会在广东珠海召开
金融科技专业委员会年全体大会在珠海顺利召开
可信区块链工作组第十次会议暨“共识算法改进思路和测试方法研讨会”在珠海召开
创新电信运营商大数据业务模式电信大数据工作组会议在珠海召开
数促会年全体大会在珠海顺利召开数据管理、数据分析应用相关四类标准即将发布
更多精彩内容,请长按治疗白癜风有什么偏方吗北京中科白癜风医院爱心捐助