数据仓库的主要组成部分不包括,数据仓库不包括以下操作

欧气 3 0

《数据仓库的组成:解析不包括的操作》

一、数据仓库概述

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策,它整合了来自多个数据源的数据,经过清洗、转换等操作后,以一种易于分析和查询的形式存储起来,数据仓库的主要操作包括数据抽取、转换、加载(ETL),数据存储,数据查询与分析等,有一些操作是不包含在数据仓库概念范畴之内的。

二、数据仓库不包括的操作:实时数据的即时处理

数据仓库的主要组成部分不包括,数据仓库不包括以下操作

图片来源于网络,如有侵权联系删除

1、与实时系统的区别

- 数据仓库侧重于对历史数据的分析,在一个零售企业的数据仓库中,它存储了过去多年的销售数据、库存数据等,这些数据是按照一定的周期(如每天、每周)进行抽取和加载的,而不是对每一笔即时交易进行处理,与实时交易处理系统不同,实时交易处理系统(如超市的收银系统)需要在瞬间处理顾客的购买行为,更新库存、计算销售额并打印小票等操作,数据仓库并不承担这种即时处理的任务。

- 实时系统对响应时间的要求极高,通常以毫秒甚至微秒为单位,而数据仓库的查询响应时间虽然也很重要,但更多是在分钟到小时的级别,一个业务分析师查询数据仓库以获取过去一个季度的销售趋势,他可以接受几分钟的查询等待时间,而在实时销售系统中,顾客等待几秒钟的结账时间可能就会产生不满。

2、数据仓库架构不适应即时处理

- 数据仓库的架构是为了批量处理和存储大量数据而设计的,它的数据加载过程通常是批量的,例如在夜间进行大规模的数据抽取和转换操作,将白天业务系统产生的数据整合到数据仓库中,这种架构并不适合处理实时的、高并发的小数据量事务,如果要在数据仓库中进行即时处理,可能会导致性能严重下降,因为数据仓库的存储结构(如星型模型或雪花模型)是为了优化分析查询而不是快速的事务处理。

- 数据仓库中的数据是经过预聚合和汇总的,销售数据可能会按照地区、产品类别等维度进行汇总存储,这种预聚合的数据结构不适合实时的、细粒度的事务处理,如果要在数据仓库中即时处理单个销售订单的详细信息,需要对预聚合的数据进行解聚操作,这将是非常复杂和低效的。

三、数据仓库不包括的操作:数据的源端业务逻辑处理

数据仓库的主要组成部分不包括,数据仓库不包括以下操作

图片来源于网络,如有侵权联系删除

1、数据仓库的集成性

- 数据仓库的主要目的是集成来自多个数据源的数据,它接收来自不同业务系统(如销售系统、财务系统、人力资源系统等)的数据,这些数据源各自有其业务逻辑,数据仓库不会在源端去修改或处理这些业务逻辑,销售系统中的折扣计算逻辑、财务系统中的会计分录生成逻辑等,都是在各自的源系统中进行处理的,数据仓库只是将这些数据按照统一的格式抽取过来。

- 源端业务逻辑通常与特定的业务流程紧密相关,如果数据仓库去处理源端业务逻辑,会导致系统之间的耦合度增加,不利于数据仓库的独立性和可扩展性,如果数据仓库要处理销售系统中的促销活动逻辑,当促销活动的规则发生变化时,不仅需要在销售系统中修改,还需要在数据仓库中进行相应的调整,这增加了维护的复杂性。

2、数据仓库的关注点

- 数据仓库更关注数据的一致性和准确性在集成后的处理,它在抽取数据后,会进行数据清洗操作,例如去除重复数据、纠正错误数据等,但这是在数据已经从源系统获取之后,数据仓库不会干预源系统如何生成数据,而是聚焦于如何将不同来源的数据整合起来,以便进行有效的分析,对于人力资源系统中的员工考勤数据和销售系统中的销售人员业绩数据,数据仓库不会关心人力资源系统中如何计算考勤,而是关心如何将这两类数据整合起来,以分析员工考勤与业绩之间的关系。

四、数据仓库不包括的操作:面向终端用户的直接业务操作

1、与业务操作系统的分离

数据仓库的主要组成部分不包括,数据仓库不包括以下操作

图片来源于网络,如有侵权联系删除

- 业务操作系统是直接面向企业员工或客户进行业务操作的,企业的客户关系管理(CRM)系统用于销售人员管理客户信息、跟进销售机会等操作,而数据仓库不是用于这些直接的业务操作的,数据仓库主要是为企业的管理层、分析师等提供决策支持,企业的高层管理者想要了解不同地区的销售潜力,他们会通过查询数据仓库来获取相关数据,而不是通过数据仓库去直接操作销售业务。

- 数据仓库的用户界面和功能设计与业务操作系统有很大的区别,业务操作系统通常有简洁的操作界面,便于用户快速完成特定的业务任务,如订单录入、库存盘点等,而数据仓库的查询界面更侧重于数据的探索和分析,支持复杂的查询条件设置、数据可视化等功能,如果将业务操作功能集成到数据仓库中,会使数据仓库的功能变得复杂和混乱,偏离其作为决策支持工具的核心目标。

2、数据仓库的分析性本质

- 数据仓库是为了分析数据中的模式、趋势和关系而存在的,它存储的数据是为了回答诸如“过去几年的销售增长趋势如何”“哪些产品在特定地区最受欢迎”等分析性问题,它不会像业务操作系统那样去执行诸如“创建一个新的销售订单”“修改客户联系方式”等具体的业务操作,如果数据仓库承担了这些业务操作功能,会影响其对数据的分析效率,并且会增加数据的不一致性风险,因为业务操作可能会频繁地修改数据,而数据仓库中的数据是相对稳定的,用于分析历史数据。

数据仓库有着明确的功能定位,其不包括实时数据的即时处理、数据的源端业务逻辑处理以及面向终端用户的直接业务操作等,这些特点使得数据仓库能够更好地发挥其在企业决策支持方面的重要作用。

标签: #数据仓库 #组成部分 #不包括 #操作

  • 评论列表

留言评论