OLAP 是指"online analytical processing"(联机分析处理),它支持动态可视化及数据分析等相关技术。
典型的OLAP工具包括"OLAP 多维数据集"及由Microsoft Excel 提供的数据透视表,这些工具采用大型数据集,并基于一套准则通过分组对其总结。例如,OLAP 多维数据集可能按产品、 地区和时期分组的销售数据进行了汇总,在这种情况下,每个网格单元格将显示为某个特定的产品,在某一特定的区域,及特定期间的销售总额。此单元格通常会表示从原始数据源中的多个记录得到的数据。
OLAP工具允许用户动态的重新定义这些分组准则(在线),使它容易对数据执行特定分析及发现隐藏的模式。
例如,参考下表:
Date | Product | Region | Sales |
Oct 2007 | Product A | North | 12 |
Oct 2007 | Product B | North | 15 |
Oct 2007 | Product C | South | 4 |
Oct 2007 | Product A | South | 3 |
Nov 2007 | Product A | South | 6 |
Nov 2007 | Product C | North | 8 |
Nov 2007 | Product A | North | 10 |
Nov 2007 | Product B | North | 3 |
现在假设您被要求分析以上数据,并回答一下问题:
销量上升还是下降?哪种产品是公司最主要的产品?
每个区域最流行的产品是哪一种?
为回答上述问题,您必须从表格中总结下述数据:按日期和产品显示销量按日期和产品显示销量
Date | Product A | Product B | Product C | Total |
Oct 2007 | 15 | 15 | 4 | 34 |
Nov 2007 | 16 | 3 | 8 | 27 |
Total | 31 | 18 | 12 | 61 |
按产品和区域显示销量按产品和区域显示销量
Product | North | South | Total |
Product A | 22 | 9 | 31 |
|
|
|
|
Product B | 18 |
| 18 |
Product C | 8 | 4 | 12 |
Total | 48 | 13 | 61 |
在汇总表中的每个单元格表示原始数据源中的几个记录,是一个或更多值字段的汇总(在本例中为销售总和),也可以是基于其他字段值的分类(日期,产品或区域) 。
这可以很容易在电子表格中完成,但这种操作是繁琐、 重复,且容易出错的。即使您写了一个自定义的应用程序来汇总数据,你很可能会花很多时间来维护它,例如添加新的视图,以及在你完成的视图上用户的分析可能会受到限制。
OLAP工具允许用户以他们特定的方式来定义他们想要的视图,他们预定义或创建和保存新的视图,对基础数据的任何更改将自动反映在视图中,用户可以创建和共享这些视图所显示的报表。简而言之,OLAP是一种工具且它提供了灵活且高效的数据分析。