大数据时代下的数据集成(一)——ETL流

大数据时代下的数据集成(一)——ETL流

文章来源:中国联通研院优管部——IT技术研究团队

作者:杨杉

1.数据集成和ETL

随着移动互联、云计算、物联等信息技术的飞速发展,越来越多的数据被产生,整个社会正在加速进入了“大数据”时代。对于企业来说,数据已经成为企业的财富,也是一种重要的战略资源。但在一个企业中,不同类型的数据通常是分布在若干个独立的信息系统中。以运营商为例,用户的计费和账单信息由信息化或市场部门的经营分析系统生成和维护,而用户在络中所产生的信令和上行为记录则由络运维部门的络运维系统存储。由于种种历史和现实原因,这些独立的信息系统之间缺少统一的接口,且数据结构差异巨大,造成企业内部的数据融合困难,也无法充分挖掘数据所包含的经济和社会价值。

如何将这些相互关联的分布式异构数据源集成在一起,能够让上层用户无视不同系统的数据差异,透明的方式访问这些数据,就是数据集成所要解决的问题。下图给出了一个典型的商业智能(BI:BusinssIntllignc)系统架构。

可以看到数据集成包含了:ETL、主数据管理、数据质量监控、元数据管理、数据生命周期管理共五大功能模块。在这个专题中,我们将依次对这些功能模块进行详细介绍,本片









































治疗白癜风的医院
白癜风能治好吗



转载请注明:http://www.92nongye.com/zyjs/204613468.html