3.1.4 数据仓库
本课核心知识点整理
本节导学
数据仓库不是替代业务数据库,而是为分析和决策服务。业务数据库每天支撑订单、转账、库存变更等事务,强调实时性和一致性;数据仓库把多个业务系统的数据抽取、清洗、集成后,形成面向主题、稳定、带历史变化的数据集合,用于报表、趋势分析和管理决策。
这一节最重要的对比是 OLTP 与 OLAP:前者处理日常交易,后者支持分析决策。
核心概念
| 概念 | 含义 |
|---|---|
| 数据仓库 | 面向主题、集成、相对稳定、反映历史变化的数据集合 |
| OLTP | 联机事务处理,面向日常业务操作 |
| OLAP | 联机分析处理,面向统计分析和决策支持 |
数据仓库的四个特点
| 特点 | 含义 |
|---|---|
| 面向主题 | 围绕客户、产品、销售等分析主题组织 |
| 集成 | 来自多个业务系统的数据经过清洗、转换、统一编码 |
| 相对稳定 | 主要用于查询分析,不频繁执行业务更新 |
| 反映历史变化 | 保存较长时间跨度的数据,支持趋势分析 |
OLTP 与 OLAP 为什么要分开
OLTP 关注单笔业务的正确和快速完成,例如下单、付款、转账。它更新频繁,并发事务多,强调 ACID、一致性和响应时间。
OLAP 关注大量数据的统计、汇总、切片、钻取和趋势判断。它通常读多写少,查询范围大,面向管理分析。如果把复杂分析查询都压在 OLTP 系统上,可能拖慢日常业务;因此数据仓库把分析负载与交易负载分离。
做题路线
| 题干关键词 | 对应概念 |
|---|---|
| 面向主题、历史数据、决策支持 | 数据仓库 |
| 日常交易、订单录入、转账 | OLTP |
| 报表分析、销售趋势、数据挖掘 | OLAP |
| 来自多个系统的数据统一整理 | 集成性 |
判断时先看系统目标:处理业务事务,还是支持分析决策。看到“历史、主题、集成、决策”,优先想到数据仓库;看到“交易、订单、转账”,想到 OLTP;看到“多维分析、趋势、报表”,想到 OLAP。
例题
下列属于数据仓库典型特点的是:
用于销售趋势分析、经营决策支持的处理更接近:
自查要点
- 数据仓库的四个常见特点是什么?
- OLTP 和 OLAP 的目标有什么区别?
- 为什么数据仓库适合历史分析?