什么是图
近几年,全球大数据进入了加速发展时期,数据量呈指数级增长。大数据中不同个体间的关联关系产生的数据以图的形式呈现。这里的图是针对数学中的“图论”而言,主要是由点和边组成的数据结构。顶点相当于树中的节点。顶点之间的关联关系,被称之为边。例如:坐在办公室的三个人,这三个人就是三个点。三个人之间的关系称之为边,如:同事关系,师妹关系,项目合作关系等等。
什么是图分析
图分析使用基于图的方法来分析连接的数据。我们可以:查询图数据,使用基本统计信息,可视化地探索图、展示图,或者将图信息预处理后合并到机器学习任务中。图的查询通常用于局部数据分析,而图计算通常涉及整张图和迭代分析。
图分析常见的应用场景
3.1社交网络分析
社交网络是十分常见的一类图数据,代表着各种个人或组织之间的社会关系,而图数据能够呈现复杂的社交网络关系,进而易于用户进行进一步的分析。例如,在一个典型的社交网络中,常常会存在“谁认识谁,谁上过什么学校,谁常住什么地方”,Facebook,Twitter,Linkedin用它来管理社交关系,实现好友推荐。
3.2电子购物应用
电子购物是互联网中的一类核心业务,在这类场景中,节点分为两类:用户和商品,存在的关系有浏览、收藏、购买等。用户与商品之间可以存在多重关系,如既存在收藏关系也存在购买关系。这类复杂的数据场景可以用属性图轻松描述。电子购物催生了一项大家熟知的技术应用—推荐系统。用户与商品之间的交互关系,反映了用户的购物偏好。例如,经典的啤酒与尿布的故事:爱买啤酒的人通常也更爱买尿布。
3.3交通网络应用
交通网络具有多种形式,比如地铁网络中将各个站点作为节点,站点之间的连通性作为边。通常在交通网络中我们比较