時間:2020-09-01來源:瀏覽數:240次
人們在談商業智能(BI)時,經常會提到OLAP,有的人可能認為OLAP工具就是BI。其實OLAP僅是BI的一部分,是很重要的一項分析技術。那什么是OLAP呢?
OLAP(Online analytical processing),即聯機分析處理,最早是由關系數據庫之父E.F.Codd于1993年提出的,主要用于支持企業決策管理分析。它的目標是滿足決策支持或者滿足在多維環境下特定的查詢和報表需求,它的技術核心是維這個概念,“維”一般包含著層次關系。因此OLAP也可以說是多維數據分析工具的集合。
①維(Dimension):是人們觀察數據的特定角度,是考慮問題時的一類屬性,屬性集合構成一個維(時間維、地理維等)。
②維的層次(Lever of Dimension):人們觀察數據的某個特定角度(即某個維)還可以存在細節程度不同的各個描述方面(時間維:日期、月份、季度、年)。
③維的成員(Member of Dimension):維的一個取值,是數據項在某維中位置的描述。(如“2020年9月1日”是在時間維上位置的描述)。
④度量(Measure):多維數組的取值。
①下鉆(Drill down):維度是有層次的,下鉆表示進入維度的下一層,將匯總數據拆分到下一層所在細節數據信息,如下圖從第二季度下探到看4、5、6月的明細數據。
②上鉆(Roll up):下探的反向操作,回到更高匯聚層的匯總數據。
③切片(Slice):切片可以理解成把立體按某一個維度進行切分,就可以看兩維數據,如圖中按電子產品切分,看到的是時間和地理位置關系的二維數據。
④切塊(Dice):相對于切片是按一個點切分,切塊就是按一個范圍(區間)來做切分。
⑤旋轉(Pivot):維的行列位置交換,換一個視角分析數據。
①快速性:用戶對OLAP的快速反應能力有很高的要求。系統應能在用戶要求的時間內對用戶的大部分分析要求做出反應,因此就更需要一些技術上的支持,如專門的數據存儲格式、大量的事先運算、特別的硬件設計等。
②可分析性:OLAP系統應能處理與應用有關的任何邏輯分析和統計分析。用戶無需編程就可以定義新的專門計算,將其作為分析的一部分,并以用戶理想的方式給出報告。用戶可以在OLAP平臺上進行數據分析,也可以連接到其他外部分析工具上,如時間序列分析工具、數據挖掘工具等。
③多維性:多維性是OLAP的關鍵屬性。系統必須提供對數據分析的多維視圖和分析,包括對層次維和多重層次維的完全支持。事實上,多維分析是分析企業數據最有效的方法,是OLAP的靈魂。
④信息性:不論數據量有多大,也不管數據存儲在何處,OLAP系統應能及時獲得信息,并且管理大容量信息。這里有許多因素需要考慮,如數據的可復制性、可利用的磁盤空間、OLAP產品的性能及與數據倉庫的結合度等。
作為商業智能BI系統的關鍵技術,OLAP可以在使用多維數據模型的數據倉庫或數據集市上進行,充分發揮OLAP的聯機分析的功能和特性。將OLAP與數據挖掘進行結合,能夠為數據挖掘提供基礎數據支持,提高數據挖掘的效率,而且還可以實現聯機分析數據挖掘的功能。
發布時間:2023-09-27瀏覽量:98次
發布時間:2022-05-11瀏覽量:354次
發布時間:2022-03-28瀏覽量:242次
發布時間:2022-03-10瀏覽量:2023次
發布時間:2022-03-09瀏覽量:223次