数据分析技术工具发展现状及趋势

1 引言当前全球的数据量正在迅速增长,预计在年将会从年的33ZB增加至ZB。互联网全球化、移动设备普及化、云计算存储低成本化、物质世界网络化,都在为“数据大爆发”储蓄能量,大数据已成为继云计算、物联网之后IT产业又一次颠覆性的技术变革[1]。大数据技术和产业的蓬勃发展,使数据成为了重要的生产力,同时也使当今社会的生产关系发生了变革。大数据时代的战略意义不仅在于掌握庞大的数据信息,还在于发现和理解信息内容及信息与信息之间的关系[2]。因此,数据分析成为挖掘数据价值的关键步骤。本文从数据可视化、自动化数据建模和情景分析出发,介绍三大数据分析领域的关键技术现状,梳理各领域的前沿工具及应用场景,总结数据可视化、自动化建模和情景分析等数据分析技术和工具的发展趋势。2 数据分析技术现状大数据分析是指在强大的支撑平台上运行分析算法,并发现隐藏在大数据中潜在价值的过程[3]。从异构数据源抽取和集成的数据构成了数据分析的原始数据,而大数据分析的核心问题是如何对这些数据进行有效表达、解释和学习[4]。因此,目前学术界一般认为数据可视化、自动化数据建模和情景感知是数据分析过程中的核心环节。2.1 数据可视化数据可视化指利用人眼的感知能力对数据进行交互的可视化表达以增强认知的技术[7]。数据可视化一般包括科学可视化、信息可视化和可视化分析3类[5]。科学可视化主要是实现对于比较具体的数据可视化,侧重于那些有自然几何结构的数据,如磁场、地理结构等;信息可视化侧重于抽象数据的可视化,如树形图、柱状图;可视化分析指在数据可视化中结合了数据挖掘等知识[6],如分析推理、视觉呈现和交互等。本文聚焦于信息可视化,以及可视化分析中的数据可视化交互。Card等人对信息可视化(InformationVisualization)的定义为对抽象数据使用计算机支持的、交互的、可视化的表示形式以增强认知能力[8],侧重于通过可视化图形呈现数据中隐含的信息和规律[9]。数据可视化起源于18世纪,WilliamPlayfair在出版的书籍《TheCommercialandPoliticalAtlas》中第一次使用了柱形图和折线图[10];在随后的多年间,直方图、饼图、折线图等广泛地应用于军事、工业、科学领域,但数据可视化技术并未发生显著进步;直至20世纪后期,计算机技术、图像处理技术和计算机视觉的迅速发展推动数据可视化由静态图表演变为动态交互图表,处理对象由二维数据扩展至高维数据;21世纪,大数据时代下,数据体量大、种类多、时效高、价值密度低的特征[11],推动数据可视化不仅


转载请注明:http://www.92nongye.com/hxjs/204621927.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了