信息化软件 企业管理 营销管理 业界消息 标签索引
信息化软件目录
OA 办公自动化 CRM 客户关系管理 PM 项目管理 CC 协同商务 BPM 业务流程管理 KM/KBS 知识管理 CMS 内容管理 SCM 供应链管理 BI 商务智能 ERP 企业资源计划 HRM 人力资源管理 EAM 企业资产管理 电子商务系统 IT综合

关于OLAP

2007-11-29
Online Analytical Processing(OLAP)是一种流行且强大的数据分析方法。它探索复杂的数据结构并以一种优雅且容易理解的方式呈现信息。IBM® DB2® Data Warehouse Edition(DWE)为 OLAP 解决方案开发人员和信息消费者提供了一套全面的 OLAP 工具。本文将介绍 IBM DB2 Data Warehouse Enterprise Edition 9.1 提供的 OLAP 服务,并解释它给开发人员和目标用户带来的价值。

关于OLAP:什么是 OLAP 服务?

On-Line Analytical Processing(OLAP)是一类软件技术,它们使用户(业务分析师、经理和执行官)能够以交互形式快速、一致地探查数据,用户看到的是经过转换后的原始数据的各种信息视图,它们可以反映业务的真实维数。

OLAP 的功能是

  • 多维的 —— OLAP 服务通过支持空间聚合路径(dimensional aggregation path)或层次结构和/或多重层次结构,提供了大量数据视图或多维的概念性视图。
  • 容易理解 —— 为 OLAP 分析设计的数据市场可以处理与应用程序和开发人员相关的任何业务逻辑和统计分析,同时使它对于目标用户而言足够简单。
  • 交互性 —— OLAP 帮助用户通过对比性的个性化查看方式,以及对各种 “what-if” 数据模型场景中的历史数据和预计数据进行分析,将业务信息综合起来。用户可以在分析中定义新的专用 计算,并可以以任何希望的方式报告数据。
  • 快速 —— OLAP 服务常常以多用户的客户机/服务器模式实现,而且无论数据库的规模和复杂性有多大,都能够对查询提供一致的快速响应。合并的业务数据可以沿着所有维度中的层次结构预先进行聚合,从而减少构建 OLAP 报告所需的运行时计算。

关于OLAP:为什么要执行 OLAP?

传统的(SQL 或其他)基于脚本的数据分析报告的构建方式常常是从两维关系数据库表中获取数据。先对这些报告进行格式化,然后将它们呈现给用户。两维报告的缺点是:

  • 报告是预定义的,内置在制作报告的应用程序中。在许多情况下,无法轻松地修改它们来适应业务报告需求的变化。
  • 修改报告或建立新的报告需要 IT 专业人员。
  • 报告用户与业务数据是分离的。

另一方面,OLAP 报告将业务数据结构、过程、算法和逻辑的复杂性集成到了它的多维数据结构中,然后向最终用户呈现容易理解的维信息视图,让他们能够以非常自然的方式探索业务数据。多维结构听起来非常复杂,其实不然。OLAP 并不在业务数据上添加额外的数据结构或维。它只是以维的方式识别复杂数据,并以非常容易理解的方式向数据消费者呈现数据。

利用 OLAP 服务,用户可以轻松地找到预定义的报告并探索业务数据,以建立新的专用 业务报告,而这些都不需要 IT 专业人员的帮助。OLAP 报告使用户非常接近业务数据,使他们能够认识到业务数据维的存在并理解哪些业务问题可以得到回答。

OLAP 报告在当今非常流行,它广泛地用作向顾客提供数据仓库解决方案的基础。

OLAP 和数据仓库

OLAP 是大多数数据仓库解决方案中使用的报告实现之一。OLAP 解决方案有时候被错误地称为数据仓库解决方案。在为某个部门或有限的用户群开发 OLAP 解决方案时,这种说法尤其容易引起误解。

数据仓库最重要的特性是数据集成,而数据仓库最重要的用途是信息数据呈现。OLAP 服务并不是主要针对数据集成而设计的;但是,它是一种强大的数据呈现方法,在大多数数据仓库解决方案中都使用 OLAP。

典型的 OLAP 服务常常源自一个或多个专门设计的数据市场。OLAP 服务应该被看作数据仓库解决方案的一部分,参见图 1。


图 1. 数据仓库中的 OLAP 报告740)this.width=740" border=undefined>

OLAP 维和层次结构

OLAP 服务涉及许多概念。我们会根据上下文的需要介绍它们。但是,在 DB2 Online Information Center 中也可以找到所有 OLAP 概念(请参阅本文的 参考资料 部分)。

OLAP 维(dimension) 能够对描述业务度量的某一方面的一组相关数据属性进行分类。维根据区域、产品或时间等逻辑类别对事实对象中的数据进行组织。

OLAP 维引用零个或更多的层次结构(hierarchy)。层次结构描述引用的数据属性的关系和结构,这些数据属性被划分为几个级别(比如时间维中的年、月和日),从而提供一种在维中进行移动的可导航且可计算的方式。

OLAP 模型和 OLAP 多维数据集

OLAP 模型和 OLAP 多维数据集是 DB2 DWE OLAP 服务中的两个重要概念。多维数据集模型代表 OLAP 数据市场中的数据结构和关系。多维数据集模型包含元数据对象,这些对象描述基表数据中的关系以及相关数据位于什么地方。多维数据集模型让信息消费者能够从一个新的视角理解数据。


图 2. OLAP 模型对象740)this.width=740" border=undefined>

OLAP 多维数据集具有一组特定的、类似但却更多限制性的、衍生自父多维数据集模型的元数据对象,这些对象包括多维数据集维、多维数据集层次结构、多维数据集层和一个多维数据集事实对象。对于每个多维数据集维,一个多维数据集只能定义一个多维数据集层次结构;但是在多维数据集模型中,一个维可以有多个层次结构。

可以使用多维数据集对多维数据集模型进行优化,使它更适应最活跃、最重要的多维数据集模型区域。可以指定优化切片,切片定义多维数据集中最常被查询的特定部分。在为多维数据集模型创建了优化(比如 MQT)之后,从这个模型派生的所有多维数据集都会因此受益。

相关链接
保险行业IT系统的未来在BI2007-12-11 Sybase最新战略调整 BI和移动占50%2007-12-13
开源商业智能(BI)工具逐步崛起2007-12-13 商业智能发动机—数据仓库引擎2007-12-17
上海证券交易所部署数据仓库八经验2007-11-13 文本分析赋予BI新契机2007-12-20
BI以业务为导向2007-11-04 决策工具新发明2007-11-03
构建动态竞争优势下的BI 2.02007-10-22 利用数据仓库实现精确营销2007-10-22
返回首页 信息化软件 企业管理 营销管理 业界消息 文档查询
Copyright © 2005-2010   http://www.ourdoc.cn, 知识文档中心