Excel BI 知识小卡片 (7-8):事实表与维度表

##

🤬 场景需求
在搭建制造业成本模型时,最常见的错误就是把所有数据——单价、BOM、产量、领料、工资——全都塞进一张大表里。结果导致公式极其复杂,数据刷新一次要等半天,而且想按“部门”或“物料类别”汇总时,发现由于数据重复录入,计算出来的总额根本不对。

这种“扁平化思维”是 Excel 报表臃肿、易错的根源。

##

💡 知识点破局
在 Excel BI (Power Pivot) 的星型模型中,必须将数据严格区分为两类:事实表 (Fact Table)维度表 (Dimension Table)

1. 事实表 (Fact Table) —— “发生了什么”
* 特征:记录业务的每一笔交易或流水(如:销售订单行、生产领料单、费用报销明细)。
* 属性:行数非常多(几万到几百万行),通常包含“数量”、“金额”等可聚合的数字列,以及一堆关联维度表的 ID。
* 口诀:事实表是“动词”,代表业务的发生。

2. 维度表 (Dimension Table) —— “主体是谁”
* 特征:记录业务实体的属性(如:产品主数据、部门清单、客户档案、日期表)。
* 属性主键必须唯一(不能有重复的产品 ID),行数相对较少,包含各种描述性文字(如:产品规格、部门层级)。
* 口诀:维度表是“名词”,用于对事实表进行分类、筛选和切割。

3. 核心关系:
永远是 维度表(1) ───指向───> 事实表(*)。通过这种一对多的关系,你可以轻松实现“按部门(维度)看成本(事实)”的动态分析。

##

⚠️ 避坑提醒
* 维度表重复值: 这是建模失败的 90% 原因。在 Power Query 中建立维度表时,最后一步务必执行“删除重复项”。
* 事实表过重: 不要把“产品名称”或“规格”写在事实表里。事实表应尽可能只保留 ID 和数值,文字描述全放在维度表里,这样能极大地节省模型内存空间。
* 数据颗粒度一致: 确保事实表的每一行代表的意义是明确的(比如:是“每日产量”还是“每单产量”),否则在与维度表关联时会出现计算逻辑混乱。


© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容