生活在当下,大数据之名如雷贯耳,却也是最熟悉的陌生人。很多人只知其名,而不知其意。多“大”才算大数据?如何利用大数据赚钱?大数据如何影响我们的生活……这些看似简单的问题,就像围绕在大数据之外的一层迷雾,遮住了大数据的庐山真面目。为一探大数据之究竟,《经济日报》刊发系列文章——“六问大数据”,为大家一解大数据之惑↓↓
一问:多“大”才算大数据
◎大数据的规模并没有具体的标准,仅仅规模大也不能算作大数据。
◎“大”是必要条件,但非充分条件。
大数据,顾名思义,“大”该是应有之义。“大数据的定义最初与容量有关系。”工信部信息化和软件服务业司副司长李冠宇分析说,业界有几种对大数据的定义,其中一个共同点就是数据的容量超出了原有的存储、管理和处理能力。
正如中国电子信息产业发展研究院副院长樊会文接受记者采访时指出的,大数据概念产生就是因为数据量和数据类型急剧增加,以至于原有的数据存储、传输、处理以及管理技术不能胜任,需要全新的技术工具和手段。
对于“多大容量的数据才算大数据”,工信部赛迪研究院软件所所长潘文说,大数据的规模并没有具体的标准,仅仅规模大也不能算作大数据。规模大本身也要从两个维度来衡量,一是从时间序列累积大量的数据,二是在深度上更加细化的数据。
李冠宇说,比如一份现在看起来很小的数据,但是纵向积累久了也可以变成大数据,横向与其他数据关联起来也可能形成大数据。而一份很大的数据如果没有关联性、没有价值也不是大数据。
运满满研究院院长徐强认为,“大”是必要条件,但非充分条件。基于移动互联网用户规模红利,国内平台型企业比较容易获取大量数据,但数据不是越多越好,无用数据就像噪音,会给数据分析、清洗、脱敏和可视化带来负担。
“大数据概念正是来自信息技术的飞速发展和应用,特别是随着云计算、物联网、移动互联网的应用,数据量迅猛增长。数据来源有两种,一种与人有关,比如政府、企业等为人们服务时产生的数据;另一种与物有关,在移动泛在、万物互联时代,物联网应用的浪潮将带动数据量爆发式增长。”李冠宇说。
这也就不难理解,为何当下数据产生的速度如此之快。正如樊会文所分析的,一方面,信息终端大面积普及,信息源大量增加;另一方面,基于云计算的互联网信息平台快速增长,数据向平台大规模集中。
大数据与云计算、物联网、人工智能等新一代信息技术之间相互影响、相互促进、相互融合。徐强说,运满满通过车联网设备和信息平台,每天获取3TB至4TB的数据,运用先进的大数据算法模型,实现了智能车货匹配、智能实时调度等。
“大数据作为重要的基础性战略资源,核心价值在于应用,在于其赋值和赋能作用,在于对大量数据的分析和挖掘后所带来的决策支撑,能够为我们的生产生活、经营管理、社会治理、民生服务等各方面带来高效、便捷、精准的服务。”李冠宇强调。
二问:大数据怎么赚钱
◎目前,大数据的金矿还仅是开挖了“冰山一角”。
◎大数据主要盈利模式围绕两方面展开,一是通过直接“搬运”数据赚钱,二是通过数据加工分析盈利。
“大数据的市场规模没有天花板。”国务院发展研究中心信息中心研究处处长李广乾认为。不过细想,这正是目前各大企业和资本疯狂追逐大数据产业的重要原因。
目前,大数据的金矿还仅是开挖了“冰山一角”。从总体规模看,年,全球大数据市场规模实现16.5%的增长,预计将连续3年保持增速在15%左右。同时,大数据成为全球IT支出新的增长点,年,有近40%的企业正在实施和扩大大数据技术的应用,另有30%计划在未来12个月内应用大数据。
“说大数据产业是一张画得很大的饼显然是片面的。”潘文预测,包括大数据硬件、大数据软件、大数据服务等在内的大数据核心产业环节,年达到亿元,将在年超过1万亿元;大数据关联产业规模年超过5万亿元,将在年超过10万亿元;大数据融合产业规模年达到3.5万亿元,将在年超过20万亿元。
“从大数据核心产业结构看,基于大数据的服务是大数据核心产业的主体,其规模约占大数据核心产业规模的90%,未来,服务也将是大数据产业的最核心部分。”潘文说。
目前国内大数据公司分为两类:一类是已有获取大数据能力的公司,如百度、腾讯、阿里巴巴等互联网巨头及华为、浪潮、中兴等企业,涵盖了数据采集、数据存储、数据分析、数据可视化及数据安全等领域;另一类则是初创大数据公司,依靠大数据工具,针对市场需求,为市场带来创新方案并推动技术发展。
不同的大数据公司,盈利模式也不相同。如果把大数据产业比作房地产开发,那么海量数据就是地产开发时的土地资源,数据挖掘开发就是地产搭建盖楼。大数据主要的盈利模式也是围绕这两方面展开,一是通过直接“搬运”数据赚钱,二是通过数据加工分析盈利。
“我们就像一个自来水厂一样,用户要你提供干净的自来水,对方可能是酒厂、饭店、饮料厂,他把你的水做成饮料或酒。”聚合数据就是一家主要依靠为客户提供数据盈利的公司,公司创始人左磊对其商业模式作了一个形象的比喻。
在开发APP应用过程中,左磊发现客户对于数据的需求非常大,但他们本身却没有能力去做这些事情。聚合数据的主营业务,就是整合市面上有价值的数据源,从车辆违章信息、航班火车查询、全国加油站实时油价,到在线试题、电影、股票,做成标准化的API(应用程序编程接口),开放给开发者、企业及白癜风早期能治好吗中科白癜风让国庆不白过