Oracle数据仓库系统产品介绍
Oracle 公司数据仓库系统产品介绍
目 录
ORACLE 公司介绍 ................................................................................................................................................... 2 ORACLE 数据仓库系统总体方案 ........................................................................................................................... 4 ORACLE 数据仓库系统工具平台 ........................................................................................................................... 7 ORACLE 数据仓库系统应用体系 ......................................................................................................................... 15 ORACLE建议方案的总体优势 .............................................................................................................................. 23 业务优势 .............................................................................................................................................................. 23 1.1.1 1.1.2 1.1.3 1.1.4 1.1.5 1.1.6 1.1.7 1.1.8 1.1.9
现成的应用产品 ............................................................................................................................... 23 统一的逻辑数据模型 ....................................................................................................................... 23 允许业务可持续发展 ....................................................................................................................... 23 最低的建设风险 ............................................................................................................................... 23 众多的成功案例 ............................................................................................................................... 23 完整的数据仓库解决方案 ................................................................................................................ 24 强大的ETL功能 ................................................................................................................................ 24 具有多种灵活的数据展现功能 ........................................................................................................ 24 快速响应时间 ................................................................................................................................... 25
技术优势 .............................................................................................................................................................. 24
1.1.10 安全可靠性 ....................................................................................................................................... 25 1.1.11 可扩展性 ........................................................................................................................................... 26 1.1.12 强大的并发能力 ............................................................................................................................... 26 1.1.13 最具开放性 ....................................................................................................................................... 26 1.1.14 系统易于维护和管理 ....................................................................................................................... 26 项目实施方法论 ....................................................................................................................................................... 27 ORACLE数据仓库实施方法论 ............................................................................................................................. 27 ORACLE项目管理简介 ....................................................................................................................................... 28 1.1.15 PJM的处理过程 ................................................................................................................................ 28 附录:ORACLE 数据仓库工具产品详细说明 ..................................................................................................... 29 ORACLE数据仓库的平台--ORACLE9I................................................................................................................... 29 ORACLE数据仓库设计和建立工具--WAREHOUSE BUILDER ............................................................................... 49 ORACLE应用服务器-- ORACLE INTERNET APPLICATION SERVER ......................................................................... 51 ORACLE即席查询分析工具--ORACLE DISCOVERER ............................................................................................ 53 WEB应用开发工具--ORACLE PORTAL ................................................................................................................. 57
Copyright @ 2001 Oracle Corporation All rights reserved.
第 1 页
Oracle 公司数据仓库系统产品介绍
Oracle 公司介绍
Oracle公司成立于1977年,是全世界第二大独立软件厂商及最大的关系数据库厂商。Oracle公司在全世界145个国家设有分支机构,2001财政年度营业额为110亿美元。Oracle公司的主要产品包括Oracle数据库服务器产品,Oracle开发工具和Oracle应用软件。 独立的市场分析组织Gartner Group下属的Dataquest 2001年的最新调查表明Oracle在Unix平台占有66%的市场份额,在NT平台占有37.9%的市场份额,从而连续而稳固地保持着领先的位置。
Oracle公司清楚地认识到一个高科技公司要在高度竞争的市场环境中始终处于领先地位,首先要在技术上有不断进取创新的精神,同时要积极探索新的技术领域。Oracle公司20多年的发展历史也充分证明了这一点。Oracle公司非常重视新技术的开发和产品的质量,投入大量资金作为开发研究投资。多年来在科研方面的巨额投资,使得Oracle在技术上一直处于世界的领导地位,这也是Oracle公司始终能够帮助客户提供完整的解决方案的根本原因。
Oracle在各个领域中也有着广泛的专业技能及行业经验。用户在选择数据库时有一个共同特点,就是不只图价格便宜,而是非常有远见地将注意力集中在产品本身的价值、系统的长期规划和解决方案的开放性上,他们都希望自己所建的系统不仅能满足当前的需要,而且能不断发展和提升,并与其它系统集成,保持它的先进性和高效率,因而,Oracle成了他们的最终选择。
Oracle公司于1985年进入中国市场,并在1989年在北京设立代表处,是第一家进入中国的世界软件巨头。1991年7月在北京建立了独资公司“北京甲骨文软件系统有限公司”,目前在国内设有北京、上海、广州和成都4个办事处,员工人数超过300人,有65%为技术支持和服务人员。Oracle公司在全国金融保险业、电信业、制造业、科技教育业、能源交通业、政府系统、航空航天业和军队等各行各业拥有极其广泛的客户群,Oracle公司先进的技术、产品及服务受到了中国用户广泛的认可和信任,同时也与众多的中国用户和企业建立了紧密的合作关系。现在,Oracle公司正致力于帮助中国企业全面有效地向电子商务运作模式转型。
先进的技术和优质的服务使Oracle在中国的用户不断扩大。Oracle公司是目前中国最大的关系数据库供应商。IDC公司1999年对中国数据库市场的调查结果表明,Oracle公司1998年在中国数据库市场的占有率为60.9%。庞大的用户队伍不只是代表了Oracle公司在中国
Copyright @ 2001 Oracle Corporation All rights reserved.
第 2 页
Oracle 公司数据仓库系统产品介绍
的巨大成功,更重要的是它为新老用户提供了借鉴经验、交流体会的良好机会,使得他们能够更充分利用Oracle的先进产品和技术。得到证明的产品和技术以及广泛的用户基础使Oracle被认为是风险最低的选择,在中国的用户遍及政府、邮电、金融、交通、能源、冶金、 国防、航空航天、教育、科研、医疗、生产制造等重要领域,并在许多行业成为数据库标准。
Oracle公司不仅及时地将最优秀的产品介绍给中国用户,而且积极地将世界上最先进的技术带到中国来。Oracle已为中国培养出5000多名学员。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 3 页
Oracle 公司数据仓库系统产品介绍
Oracle 数据仓库系统总体方案
Oracle 公司在大量国外数据仓库的实施过程中已总结出一套数据仓库总体解决方案框架,结构如下图:
Oracle的数据仓库系统的逻辑体系架构是由3层组成:
数据获取层:实现如何从所有源系统中获得原始的业务数据,并对其进行一致性处理,按主题进行数据重组和格式转换,然后传送并装载到数据仓库系统中。 数据管理层:把数据存储到企业级数据仓库系统中进行集中管理;
数据使用层:实现如何把数据仓库系统中的数据和分析结果提供给最终用户。按照用户的分析需求,使用报表、随即查询、多维分析和数据挖掘进行数据展现。
下面将对这3层进行详细的讨论:
Copyright @ 2001 Oracle Corporation All rights reserved.
第 4 页
Oracle 公司数据仓库系统产品介绍
数据获取层
数据仓库系统需要从多个源数据系统中抽取和汇总各种业务数据,这些数据源系统是数据仓库系统的数据来源。
系统按照满足分析需求的原则,把上述数据源系统中的数据按照主题进行划分和组织,然后抽取并装载到数据仓库系统中。
从上述这些系统中获取数据需要三个过程:抽取数据、数据转换和数据装载。
这三个过程是在保证各个数据源系统与数据仓库系统能够成功连接(包括网络协议标准的转换、不同平台之间的接口)的前提下实现的。
这三个过程主要完成确定从哪个系统中抽取什么样的数据,如何保证来自不同源数据系统的同类数据的一致性和完整性,如何把转换完成的数据装载到数据仓库系统中,以及如何处理在转换和装载过程中出现的错误。 数据管理层
在数据存储层,数据是存放在两类数据库中:关系型数据库和多维数据库。数据存储是数据仓库系统的中心。取自多个数据源系统的明细数据,以及用于分析的集成汇总数据都存储在这个中心。它在逻辑上是一个完整的库。 数据使用层
数据输出层的功能是使最终用户通过报表、图形和其它分析工具的方式简便、快捷地访问数据仓库系统中的各种数据,得到分析结果。
Oracle 为客户提供多种数据分析方法,包括标准报表、即席查询报表和动态分析报表,预测,假设分析(What-if)和数据挖掘等。
标准报表和即席查询报表是基于关系型数据库/多维数据库的报表输出,标准报表是一种格式固定、内容仅依据预定义的条件变化的报表,是在系统开发时根据用户需求定制的,最终用户无法自己修改。即席查询报表的格式和内容可以由最终用户自由选择,即支持即席查询。允许最终用户控制数据的访问方法,定义报表格式和报表中的数据内容。动态分析报表支持客户对数据进行旋转、切片和分层,并从各个角度对数据进行分析和比较。预测主要是根据历史数据推断将来的数据趋势。假设分析允许用户设定一些假设条件,观察
Copyright @ 2001 Oracle Corporation All rights reserved.
第 5 页
Oracle 公司数据仓库系统产品介绍
条件成立的情况下相关指标的变化。数据挖掘是利用多种数学的分析方法建立模型,找出隐含的业务规律。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 6 页
Oracle 公司数据仓库系统产品介绍
Oracle 数据仓库系统工具平台
数据仓库是一个建设过程,Oracle 公司在数据仓库建设的每一个环节上都提供了相应的技术手段及工具来保障数据仓库的顺利实现。下图所示为Oracle 公司为数据仓库系统的技术平台提供的建议。
Oracle 公司在多年数据仓库开发过程中已开发出符合数据仓库建设每一阶段所需要的开发工具,这对保证数据仓库建设的顺利完成提供了保障。以下为Oracle 公司为数据仓库系统技术平台的配置内容: 数据获取层配置:
Oracle Warehouse Builder(OWB) —实现数据仓库的设计、部署和管理,包括数据建
模、数据抽取、数据转移和装载、聚合、元数据的管理等。 数据管理层配置:
Oracle 9i RDBMS—进行数据存储及管理,同时集成了OLAP 和Data mining 功能。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 7 页
Oracle 公司数据仓库系统产品介绍
Oracle 9i OLAP—多维分析服务器 Oracle 9i Data Mining—数据挖掘引擎
Oracle Enterprise Manager—数据仓库图形化管理工具 数据展现层配置:
Oracle Reports—数据仓库前端应用报表开发工具 Oracle Discoverer—数据仓库随即查询、报表工具 Oracle Internet Application Server—应用服务器
Oracle BI Beans—由Oracle9i Java OLAP API 构造的商业智能套件 Oracle Portal—企业门户信息开发工具 Oracle Financial Analyzer—财务分析应用 Oracle Sales Analyzer—销售分析应用
根据IDC的报告,大约80%已投资于数据仓库的公司都已获得了巨大的成功。这是因为数据仓库提供了与OLTP系统截然不同的集中式存储系统,前者包含了从公司拥有的许多数据库中提取出来的业务数据。这些数据生动地反映了企业承包的现实,被予以分析,以及作为战略性的竞争武器。快速,准确地分析商业问题,将会影响公司的长期生存。 Oracle数据仓库支持: 1、任何数据源(Any Source)
搜集在Oracle数据仓库中的数据来源众多,包括内部存储的业务数据和外部的数据。在传统上,数据仓库中的大多数数据来自内部业务系统,如业务系统或各客户信息系统等方面的数据。然而外部来源的数据也越来越普通,并且将会提供比内部来源更多的数据。上述两种数据来源应该融合在一个单一的存储系统中,并且加以管理,从而为最终用户提供对这两种数据源的无缝访问。Oracle提供各种网关(gateway)及Sql*Loader以及合作伙伴提供的各种工具来实现不同数据源数据的加载。 2、任何数据(Any Data)
Copyright @ 2001 Oracle Corporation All rights reserved.
第 8 页
Oracle 公司数据仓库系统产品介绍
考虑到现在需访问的数据仓库的用户范围,系统设计者面临着纷繁各异的需求。对数据的访问必须快捷,直观和直接。大多数用户需要直接查询和深入的能力,而另外一些需要更复杂的分析能力。同时数据仓库必须能够处理新型格式的数据,如声音,视像,文字和空间数据。而且,日益增加的用户提出大量历史性需求,往往导致超大规模数据库(VLDB)的出现。为了满足这些需求,对作为数据仓库核心的数据库系统提出了很高的要求,而ORACLE数据库核心能够完全满足这些需求。 3、任何访问需求(Any Access)
Oracle提供了基于数据仓库的范围广泛的工具集,能够帮助各种类型的用户访问数据仓库中存储的数据,我们把数据仓库的用户分为两类:第一类是对数据进行随意查询和报告,深入和旋转,这类用户需要一种直接和直观的工具,帮助他们轻松地访问数据,从而作出明智的商业决策。另外一类用户是企业的高级管理者和决策者,他们需要进行更复杂更高级更完全的分析(建模,预测和假设分析等),以支持制定商业策略。上述两类用户体现了整个企业对于信息访问的需求。今天的数据仓库已经突破了管理人员和分析人员的范围,现在各类企业人员都在使用数据仓库,决定选用何种工具实施数据仓库,变得越来越重要。
Oracle提供完整的产品工具集,满足上述数据仓库的用户需求:
Oracle Warehouse Builder(OWB)可以为数据仓库解决方案提供完整、集成的实
施框架,以前只能由单独工具完成的功能现在能够在同一环境中实现,这些功能包括:数据建模、数据抽取、数据转移和装载、聚合、元数据的管理等。Oracle Warehouse Builder还实现了数据仓库不同部件如关系数据库、多维数据库以及前端分析工具的集成,为用户提供完整的数据仓库和商业智能系统。 OWB具有如下特点:
全面的数据仓库设计、部署和管理功能 利用数据库服务器提高性能 与前端分析工具紧密集成 开放、可延伸的框架
支持复杂的提取、转换和传输(ETT) 过程
Copyright @ 2001 Oracle Corporation All rights reserved.
第 9 页
Oracle 公司数据仓库系统产品介绍
集成元数据管理
Oracle 9i 数据仓库核心引擎,其中Oracle 9i为最新版本的数据库产品,专门针对数
据仓库进行了很多的改进,包括对更大数据量的支持(PB级),对更多用户数的支持(10000+),更多数据仓库专用函数的支持等。集成了ETL、OLAP、Data Mining功能。 Oracle 9i 数据仓库核心引擎具有以下特点: 高可靠性、高可用性
强大的伸缩性和性能,强大的并行处理能力,支持复杂的,大数据量的、突发查
询的能力
快速响应时间,高性能 强大的复杂查询技术 高可扩展能力
支持大容量,TB级的数据存储能力 高安全性 开放性 易于管理与维护
专门集成了数据仓库所需的ETL、OLAP、Data Mining功能
Oracle Internet Application Server是目前市场上综合性最强,集成度最高的应用服
务器. 它可以运行任何网站,门户或互联网应用, 并且其速度比市场上其他应用服务器都要快. Oracle Internet Application Server 能让您通过传统浏览器和任何移动设备访问网站和应用. 通过集成商务智能, 它可以满足您最新的商务信息需求. 它还加进了一套综合的管理,集成和协作技术, 使您能够简化操作,提高效率,从而更有效地与您的贸易伙伴合作。
Oracle iAS由四部分服务组成: 通讯(Communication Services)
Copyright @ 2001 Oracle Corporation All rights reserved.
第 10 页
Oracle 公司数据仓库系统产品介绍
表示(Presentation Services) 商业逻辑(Business Logic Services) 系统服务(System Services)
Oracle iAS还包含了一系列的开发工具:Forms、Reports以及Discoverer。 Oracle iAS具有以下特点:
提供完整的功能选件,如门户,无线,企业集成
提供从开发工具到应用服务器,到后台数据库的完整解决方案, 如支持数据库 提供Web缓冲功能
提供单次登录及集成的目录服务器功能
提供广泛的应用服务器的管理与监控工具,监控对象包括应用服务器本身的运行
状态,网站内容访问,如访问频度分析器、相应的报告工具等 提供完整而集成的商业智能工具,如报表功能,数据分析功能 提供集成的网站分析工具
支持目前主流的Web 服务器,同时提高其安全性和可控制性 提供相应的IDE 开发环境,缩短开发测试周期。 提供对复杂Web Services的支持, 并且完全支持业界标准
跨平台支持,包括操作系统和数据库系统,以提高应用的灵活性和可移植性。 XML 支持,支持XML 数据的解释和输出。
强大的安全功能,包括安全套接层(SSL)、授权、数字认证和访问控制。 提供大量现成的组件,可以用于快速构建Web 应用程序。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 11 页
Oracle 公司数据仓库系统产品介绍
Oracle Discoverer 是最终用户查询,报告,深入和旋转和WEB公布工具,能够帮助
用户迅速访问关系型数据仓库、数据集市和业务系统,从而使他们做出基于充分信息的决策。
Oracle Discoverer具有以下特点: 超乎寻常的易用性 快速查询及相应性能 强大钻取功能
强大自动汇总重定向能力 资源控制能力 低维护的最终用户层 基于服务器的可伸缩性 开放式访问
Oracle Developer(Forms&Reports) 一个用于建立企业级客户/服务器和Web数据
库应用的、易于使用的集成式快速应用开发环境(RAD)。Oracle Developer通过使用快速应用开发技术(RAD)技术、面向对象技术,基于计算机的内部学习,以及统一的客户、应用服务器和数据库服务器体系结构,为客户/服务器和Web开发建立了新的易于使用的生产力标准。
Oracle Developer(Forms&Reports)具有以下特点: 易于使用及开发 丰富的报表样式
多种文件格式(PDF,HTML,XML,XSL) 可扩展的性能(Report Server) Web 发布
Copyright @ 2001 Oracle Corporation All rights reserved.
第 12 页
Oracle 公司数据仓库系统产品介绍
Oracle BI Beans 是集合了一系列标准Java Bean,帮助开发人员快速建立商业智能
应用程序。直接从Oracle 9i数据库中产生快速、灵活的随即查询和多维分析。 Oracle BI Beans有以下部分组件组成: 演示组件(图形、交叉表和图表) OLAP 组件(查询和计算创建器) 目录服务
多个组件将 JDeveloper 作为商务智能应用程序的开发环境,协同操作,利用 Oracle9i 技术堆栈和 Oracle9i OLAP 的高级分析特性,提高应用程序开发人员的开发效率。 Oracle Enterprise Manager Oracle Enterprise Manager是一套开放的综合系统管
理系列产品,它包括了下一代系统管理工具,可以高效地管理整个Oracle环境,包括系统、数据库、网络和应用程序,可以大大减少系统管理员用于管理复杂产品环境的时间。
OEM有以下四部分组件组成:
Oracle Diagnostics Pack 能够让数据库管理员实施对 Oracle 环境的高级监控、诊断
和规划。
Oracle Tuning Pack 为数据库管理员提供了对 Oracle 环境的专家级性能管理能力,
包括 SQL 优化调整和存储最优化。
Oracle Change Management Pack 能够消除在升级数据库以支持新应用时(可能产
生的)数据错误与丢失。此工具包分析与应用变更有关的影响和复杂的依赖性,并自动实施数据库升级。
Oracle Management Pack for SAP R/3 提供了对 SAP R/3 系统的实时监测能力、用
于历史分析和未来规划目的的容量计划、事件集成以及对主机、数据库和应用的单点管理功能。 OEM具有以下特点:
使用统一的体系结构管理着整个数据仓库系统
Copyright @ 2001 Oracle Corporation All rights reserved.
第 13 页
Oracle 公司数据仓库系统产品介绍
集中控制平台单一视图管理 实时监控 分布式数据管理
Copyright @ 2001 Oracle Corporation All rights reserved.
第 14 页
Oracle 公司数据仓库系统产品介绍
Oracle 数据仓库系统应用体系
Oracle 公司在长期规划与设计数据仓库系统时,充分考虑到企业中整体企业发展、部门要求、用户要求等因素,利用企业级的数据仓库品平台(EDW)为基础设计出如下的企业级数据仓库应用体系。
上述应用体系根据企业不同管理层面及部门职能提供了三大类应用。
1. 战略企业管理(SEM):该体系是针对企业战略管理部门而设计的,该体系由综合平
衡记分卡、全面成本管理两大模块组成。
2. 分析、计划及模拟管理:该体系是针对业务部门分析人员而设计的,该体系由绩效分
析、财务分析、销售分析及预算计划控制组成。
3. 业务智能管理:该体系是针对部门级管理者而设计的,该体系由客户智能、营销智能、
销售智能、服务智能、采购智能、流程管理智能、财务智能、交互中心智能组成。
下面简单地介绍各个模块的功能:
Copyright @ 2001 Oracle Corporation All rights reserved.
第 15 页
Oracle 公司数据仓库系统产品介绍
战略企业管理(SEM)
综合平衡记分卡:Oracle® Balanced Scorecard可将组织的战略转换成一整套关键绩效
指标(KPI)。这些KPI通过跟踪以下四个方面的绩效来评估公司的整体业绩:财务、客户管理、内部和外部业务处理以及组织的知识更新学习和业务成长。通过用图示的方式描绘关键绩效指标间的因果关系,Oracle Balanced Scorecard使决策者不仅能够清晰地理解自己的决策是如何影响自己直接负责的部门,而且还能明白这些决策对其他部门以及公司总体战略的影响。 综合平衡记分卡具有以下关键特性: 采用先进的企业绩效管理方法 模拟功能 预测功能 细分功能 指标关联
全面基于Web浏览方式 安全性管理机制 向导式图形化界面
基于活动管理: Oracle基于活动的管理是一个企业级应用软件,它是基于活动的成本
计算(Activity Based Costing,ABC)和基于活动的管理系统,ABM使用先进的利润率分析模型及基于活动的成本计算方法为企业提供精确的成本信息。ABM可帮助企业计算活动、材料、资源、产品、服务的精确成本、对未加利用的生产能力的成本的度量、生成多个成本计算方案,回答“假设分析”问题、建立部门预算等。 基于活动管理的关键特性: 建立模型
建立成本分配和映射 建立层次结构
Copyright @ 2001 Oracle Corporation All rights reserved.
第 16 页
Oracle 公司数据仓库系统产品介绍
分析成本构成要素 强大的计算功能 设计方案和版本生成 可视化追踪 编制预算 Web报表 安全 性 技术和可伸缩性 分析、计划及模拟管理
绩效分析:绩效分析是建立在总帐、统计、帐户、交易数据的基础上进行计算的。Oracle
绩效分析系统可提供多种方法进行利润计算。如金融业中计算银行的利润可通过计算帐户的利润贡献度,再由帐户的利润贡献度。计算出客户的利润贡献度,再计算出产品利润贡献度,再计算出机构利润贡献度,最后计算出全行的利润贡献度。帐户利润贡献度是有以下五部分组成:利息收入、利息支出、手续费收入、其他支出、风险准备。
绩效分析关键特性: 精确的计算能力 强大的分析能力 分配功能 强大的报表功能 集成能力
财务分析:是专用于财务报告、分析、预算编制和规划的分布式应用。通过中心数据
源和强大的分析工具的集成,这个系统将帮助企业满足其重要的目标,这些目标包括控制成本、分析性能、评估机会、提交和合并预算以及规划未来发展方向等。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 17 页
Oracle 公司数据仓库系统产品介绍
基于财务分析的关键特性: 强大的查询和分析 财务建模能力 预算、预测和计划 报告和图表 集成能力
销售分析:是一个应用广泛的分析应用产品,用于分析销售、市场或者诸如此类的数
据。可以使用这一产品评估销售趋势、市场开拓活动,产品利润,产品生存周期,以及促销效果。一旦评估完成,该系统能够通过定制分析,帮助用户调整策略。 基于财务分析的关键特性: 强大的查询和分析
内置的销售与市场营销技术 可以启用数据仓库与数据集市 预算、预测和计划 报告和图表 集成能力
业务智能管理
客户智能:是基于Web方式,提供全方位的客户信息查询、分析和监控的系统。利用
客户智能可帮助企业制定获取客户、保留情况和提升客户利润贡献度的客户管理策略。客户智能还可以对产品的毛利、客户满意度、忠诚度、以及客户生命周期进行分析,并通过先进的绩效管理框架对客户利润贡献度进行评估进而制定客户细分策略。 客户智能的关键特性:
Copyright @ 2001 Oracle Corporation All rights reserved.
第 18 页
Oracle 公司数据仓库系统产品介绍
客户单一视图 客户个性化服务 客户分析 客户生命周期分析 产品的毛利分析 客户满意度分析 忠诚度分析 客户利润贡献度分析
营销智能:是通过分析、报告、管理和监控营销信息来帮助企业的高级执行官、营销
专家和分析人员制定战略性的营销策略。营销智能提供着强大的营销活动分析、销售渠道分析、销售线索分析、产品分析、客户分析和个性化服务功能帮助企业提高营销能力。
营销智能的关键特性: 全面市场营销业绩分析 可定制的的个人主页(PHP) 提供早期预警的绩效测量指标自动报警 绩效管理框架
与Oracle电子商务套件的集成 友好的展现界面
销售智能:是提供全面的销售团队分析、销售业绩分析、根源分析和业绩管理来帮助
企业领导者制定销售策略及对销售业务做出快速反应市场的能力。销售智能还提供很多随时可以运行的智能报告和分析手册,并且具有搜索引擎,用以引导用户根据其商务方面的问题查找适当的报告和手册。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 19 页
Oracle 公司数据仓库系统产品介绍
销售智能的关键特性: 全面销售分析报告
可定制的的个人主页(PHP) 提供早期预警的绩效测量指标自动报警 绩效管理框架
与Oracle电子商务套件的集成 友好的展现界面
服务智能: 提供强大的服务智能分析(服务请求状态分析、服务请求解决方案分析、
代理商/分析人员效率分析等)和个性化服务来分析与服务相关活动的全面信息,监控服务质量。最终帮助企业制定更合理高效服务策略。 服务智能的关键特性: 轻松地访问服务分析信息 直观的客户搜索功能 强大的报表功能
简单易用--经过简单的培训就可以熟练掌握 可以进行配置和个性化
与Oracle Service应用软件、Oracle CRM应用软件、Oracle ERP应用软件一起进行
集成前分析 绩效管理框架
目前唯一一个不需要任何第三方商务智能工具或技术就可以提供与打包应用软件
的企业应用软件提供商
采购智能:是Oracle完整的互联网采购(Internet Procurement)解决方案套件的一部
分,它提供一些工具,可用于确定哪些供应商一直在及时提供质优价廉的产品和服务。采购专业人员可以在Oracle Purchasing中获取这些信息并用来建立供应商战略联盟,
Copyright @ 2001 Oracle Corporation All rights reserved.
第 20 页
Oracle 公司数据仓库系统产品介绍
改善供应商关系,更直接地将重点放到改进供应商服务的机会上。另外,一旦建立了与供应商的关系,他们的电子目录即可供你公司员工用来选择和采购其产品和服务。 采购智能的关键特性: 支持灵活的业务 个性化服务 业绩评价 丰富报表
结合Discoverer工作簿提供强大的分析功能
流程管理智能: 为流程制造商提供产品、生产、存货和成本信息以解决流程制造业中
的特定问题,为流程制造商提供更好的决策信息和持续流程改善的建议。 流程管理智能的关键特性: 商务智能 个性化服务 绩效管理框架 分析工作手册 流程制造智能 生产效率报告 存货报告 存货状况评测 产品分析 成本分析
Copyright @ 2001 Oracle Corporation All rights reserved.
第 21 页
Oracle 公司数据仓库系统产品介绍
财务智能: 提供一种易于使用的Web格式的财务盈利状况分析报表、现金流分析报表、
现金状况分析报表、资产管理分析报表、项目报表分析报表等,方便企业迅速地分发财务信息从而使财务主管能更及时地作出更好的决策。 财务智能的关键特性: 商务智能 财务盈利性分析 现金流分析 现金状况分析 资产管理分析 项目绩效分析
交互中心智能:Oracle交互中心智能将呼叫数据与业务数据进行合并,通过分析呼叫
中心活动的概况,利用绩效管理框架评估呼叫中心的效率及客户表现。 交互中心智能的关键特性: 全面交互中心分析
可定制的的个人主页(PHP) 绩效管理框架
与Oracle电子商务套件的集成 用户界面友好的报告
Copyright @ 2001 Oracle Corporation All rights reserved.
第 22 页
Oracle 公司数据仓库系统产品介绍
Oracle建议方案的总体优势
Oracle针对数据仓库系统的建议方案具有以下的优势:
业务优势
1.1.1 现成的应用产品
Oracle的数据仓库解决方案是建立在“业界最佳实践”部件上的集成解决方案。这些解决方案融合了数据、分析信息、业务规则、层次结构和报告方法。所有这些产品部件都是基于一个集成框架而设计的,它涵盖了客户对数据仓库的全部业务需求,因此是一个完整的数据仓库解决方案。
大量成熟的应用产品,众多的国外企业使用着Oracle产品。
1.1.2 统一的逻辑数据模型
Oracle 公司在各个业实施数据仓库系统时,使用统一的行业逻辑数据模型,逻辑数据模型具有完整性、可扩展性等特点。但其中的每一个模块又是独立的,可以单独使用。因此在实施数据仓库项目中,可以按照“总体规划,分步实施”的原则,逐步推进数据仓库项目的实施。首先实现最关心的主题,然后再逐步加以扩展。
1.1.3 允许业务可持续发展
Oracle的数据仓库解决方案是可伸缩的解决方案,它能够适应客户的业务变化,以及由此产生的数据变化,和数据库规模的增长。
1.1.4 最低的建设风险
使用严格的数据仓库实施指导方法论来指导数据仓库的实施。Oracle的数据仓库解决方案是经过在全球上百家大型企业实施证明过的切实可行,能够真正满足企业决策分析要求的解决方案。选择Oracle的数据仓库解决方案,可以降低数据仓库项目的实施风险,保证项目的成功。
1.1.5 众多的成功案例
Oracle 为国内外几百家大型企业提供了数据仓库解决方案,并成功地参与实施。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 23 页
Oracle 公司数据仓库系统产品介绍
技术优势
1.1.6 完整的数据仓库解决方案
Oracle 数据仓库解决方案提供了从数据获取、数据管理和数据展现三大过程,Oracle 公司是唯一一家能提供数据仓库建设每一阶段的开发工具得厂家。Oracle 9i数据库更集成了ETL、OLAP、Data mining功能,使得数据库的功能更加强大,数据仓库的集成度更高,数据仓库的管理更加容易。
1.1.7 强大的ETL功能
面对客户复杂的业务系统,多种的数据源,海量的数据。Oracle Warehouse Builder(OWB)提供为快速、准确、智能化管理的ETL工具,帮助客户完成数据仓库的设计、部署和管理,并制定自动化处理流程。ETL既有建模功能,又有数据抽取、转化、清洗和转换功能,大大减小了开发的工作量。
1.1.8 具有多种灵活的数据展现功能
数据仓库系统应提供报表、随机查询、联机分析(OLAP),预测,数据挖掘等多种功能以支持复杂的分析操作,提供决策支持。
Oracle提供了多种联机分析工具, Discoverer是一个直观的即席查询、浏览、报表输出和Web信息发布工具,能够帮助企业内部各个层次的商业用户获得快速访问关系数据库中数据的能力。
提供多种查询工具、灵活的即席查询方法、图表制作方便快捷
数据仓库系统的用户经常需要多层次、多视角地查看跨主题、跨业务范围的信息,并可以针对这些查询统计条件进行自由的组合以产生能满足用户需要的查询统计信息。系统应提供多种方式的查询统计工具以满足众多用户不同层次上的需求:对管理人员提供决策支持,对一般人员提供查询统计报表。系统需要提供相关的工具,使开发人员可以在已有数据的基础上迅速方便地生成各种图表并能以灵活组合图表的方式产生输出。 Oracle提供了多种数据仓库的查询工具,通过建立业务模型,可以方便地即席查询,获得所要的信息或报表,同时还可用图表的方式得到查询结果,不需要为每个查询写不同的程序。对于批处理报表可以用Oracle Reports工具实现。这些工具均支持Web应用,能够实现开发一次,运行在多种工作模式(Client/Server、Internet/Intranet)下。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 24 页
Oracle 公司数据仓库系统产品介绍
Oracle 9i OLAP产品系列提供了多种复杂的分析能力,其中包括预测,建模和假设(What-if)分析。
Oracle 9i Data Mining提供了多种复杂的数据挖掘算法,其中包括分类与预测等。利用Oracle 9i Data Mining 提供的多种方法,用户可以建立各种复杂模型寻找潜在的业务规律。
1.1.9 快速响应时间
数据仓库系统要求数据要以高度规格化方式进行组织,通过智能合计和查询间并行性使数据仓库变得更小来能提高查询性能。要充分考虑到统计、查询、分析、决策等各项功能的需要,要为复杂的查询提供最快的反应时间。
Oracle数据库中的多种处理优化机制,如并行查询、并行插入更新和删除操作、并行装载、并行索引建立、分区技术等等,加上具有丰富经验的数据仓库整体应用结构和硬件结构的合理设计、数据逻辑结构和物理结构的合理设计,保证了系统的快速响应时间。
1.1.10 安全可靠性
客户的数据仓库系统必须提供一套广泛而严密的安全机制,确保数据在存放、备份、传送和使用等环节上的安全性;要有大量的备份及恢复程序来减少数据丢失的可能性,具有灾难备份的功能;建立完善的操作人员授权机制把数据通过授权的方式保护起来,设立数据存取等级;对敏感数据的传输要进行加密,以防止数据被破坏、窃取;要有严密的措施来防范非法入侵。另外,对数据的操作在日志文件里也都要有记录以便于日后进行跟踪。 系统的安全性首先包括对系统数据访问的安全性。Oracle基于角色的安全控制通过灵活及易于管理的授权方式,保证了数据访问的安全性;另外还可以通过视图、数据库触发器等实现特殊的数据安全性;Oracle数据库的审计功能还可跟踪记录系统的各种操作,用于查找可疑的操作。
对于因系统、介质故障引起的数据损坏,通过Oracle提供的各种备份恢复方法来恢复数据,如数据库物理备份、逻辑备份、容灾备份等等。
另外数据仓库系统还可以利用网络、操作系统的安全控制来实现其综合的安全性要求。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 25 页
Oracle 公司数据仓库系统产品介绍
1.1.11 可扩展性
建设数据仓库系统是一个长期的大型项目,因此,我们一定要保证系统具有广泛的适应性和可扩充性,可以根据规划分期分批建设。要求必须有很强的扩充能力,逐步升级和扩充,以保持系统的连续性,避免出现重构数据仓库系统的事件。
Oracle数据库系统具有很好的扩展性,Oracle数据库可运行在各种SMP、Cluster、MPP硬件平台上,当硬件平台扩展时,可充分利用硬件平台的处理能力。建立在Oracle数据库上的数据仓库随之具有扩展能力。
Oracle数据库对于系统的数据容量基本没有限制,但数据大量扩展时,要考虑系统的I/O性能;通过利用高I/O性能的存储系统及合理的数据库结构的设计,满足系统的数据扩展性要求。
1.1.12 强大的并发能力
Oracle数据库具有很强的并发性,可以支持10000个以上的用户同时对数据库的访问,保证了数据仓库系统较高的并发访问能力。
1.1.13 最具开放性
数据仓库系统要求系统在硬件设备、操作系统、数据库管理系统以及应用系统方面具有开放性。
Oracle产品是基于业界标准的,具有良好的开放性。
1.1.14 系统易于维护和管理
对于数据仓库系统的维护,Oracle提供了图形化的易用的维护管理工具OEM(Oracle Enterprise Manager),备份恢复工具RMAN(Recovery Manager)等,使维护工作变得方便;另外在数据仓库的开发中为数据仓库定制的维护程序,将使一些维护工作自动化。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 26 页
Oracle 公司数据仓库系统产品介绍
项目实施方法论
Oracle数据仓库实施方法论
Oracle数据仓库实施方法论(DWM—Data Warehouse Method)是Oracle公司在全球经过多年的数据仓库系统实施而提炼好的结构化实施方法,详细定义了用于构造一个完善的、满足业务功能的数据仓库系统所不可缺少的步骤和任务。DWM是一组预定义好的、在整个数据仓库项目中起指导作用的、可用多种方法管理的实施步骤。DWM可以帮助我们解决诸如确定正确的系统范围和用户需求、建立灵活的系统架构以满足不断变化的应用需求以及不可预测的使用需求等等比较棘手的问题。
Oracle数据仓库实施方法论中的增量实施法把数据仓库系统的实施分为13个过程,7个阶段。如下表所示:
过程 阶段 业务需求定义 数据获取 系统结构定义 数据质量控制 数据仓库管理 元数据管理 数据访问 数据库设计与建立 文档设置 系统测试 培训 系统上线 技术支持 实施 策略 34.6% 8.4% 11.5% 2.2% 3.4% 3.7% 6.3% 1% 1.2% 0.5% 系统 定义 9.3% 8.5% 22.2% 12.1% 4.4% 1.1% 7.7% 系统 分析 13.3% 23.1% 14.3% 6.5% 3.9% 2% 7.4% 2.7% 1.7% 系统 设计 16.4% 5.4% 7.9% 11% 4.7% 4.7% 4% 4.5% 15% 4.1% 0.2% 系统 建立 17.2% 14.5% 0.6% 16.1% 4.9% 4.9% 2% 3.9% 19.8% 4.7% 0.4% 系统 应用 21.4% 19.7% 27.8% 17.8% 系统 维护 45%
上表中各个过程中的阴影表示每个过程涉及到哪个实施阶段,表中的百分比表示以一个中等规模的项目为例,每个过程在各个实施阶段中所占的比例。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 27 页
Oracle 公司数据仓库系统产品介绍
ORACLE项目管理简介
根据Oracle顾问在全球实施各种项目所得的项目管理经验,Oracle公司建议数据仓库系统的项目管理采用或参考ORACLE项目管理方法(Project Management Method----PJM)。 PJM是ORACLE为IT(Information Technology)项目管理所提供的标准实施方法,其目的在于提供一个统一的管理模式,用于IT项目的计划、评估、控制与完成。由于IT项目具有高度的不确定性,同时实施工具与技术迅速更新,所以,当项目采用了多种实施方法、实施工具和实施途径时,统一的管理模式是达到预期目的所必不可少的。
PJM针对IT项目的独特管理需求,提供有效的方法,清晰准确地定义客户需求,并使该需求在整个项目周期(lifecycle)中保持可见,同时,提供规范的控制机制,使项目团队可以共享项目的相关资料与信息。
1.1.15 PJM的处理过程
PJM是基于处理过程的(Process Based)方法论,因此适用于IT项目管理的各个阶段的各种独特需要。
alPnnnignoCtrolmoCpletionControl and ReportingWork ManagementResource ManagementQuality ManagementConfiguration Management
Copyright @ 2001 Oracle Corporation
All rights reserved.
第 28 页
Oracle 公司数据仓库系统产品介绍
附录:Oracle 数据仓库工具产品详细说明
Oracle数据仓库的平台--Oracle9i
数据仓库引擎 Oracle9i 是现今用于数据仓库的主流关系数据库的最新版本。Oracle 常被用作数据仓库是因为它成功地满足了数据仓库的核心要求:性能、可伸缩性和可管理性。由于数据仓库存贮更大量的数据、支持更多的用户和要求更高的性能,因此对于数据仓库的成功实现,这些核心要求就成为至关重要的因素。Oracle9i 继续侧重于这些核心要求,并且在Oracle8i 数据仓库性能的各个方面都有显著的提高。
然而,Oracle9i 远远超过了数据仓库的这些核心要求:性能、可伸缩性和可管理性。Oracle9i 是第一个真正的“商务智能平台”。商务智能系统远远超出数据仓库。它通常包括更复杂的分析能力如OLAP 和数据挖掘功能。
Oracle9i 不仅是数据仓库的基石,它也是商务智能的基石。Oracle9i 在三个方面提供了新的服务器功能:OLAP(联机分析处理),ETL(提取、转换、加载)和数据挖掘。
Oracle 9i具有以下特点 1. 高可靠性、高可用性
Oracle9i 大幅度地扩展了 Oracle 在 数据仓库可用性方面的领导地位。关键领域包括: 世界领先的数据保护技术
Oracle9i 包括许多改进数据保护的新特性。除了对现有(物理)“备用”产品的重大增强外,还包括了一个新的逻辑“备用”功能,以及为逻辑和物理特性提供监视、自动化和控制的框架。新的逻辑备用数据库为了重新应用于备用数据库将重做日志文件转换为 SQL 语句。这减少了损坏传播到备用数据库的风险,并允许在备用数据库上并发地运行报表与逻辑日志应用程序。它还允许在备用数据库上创建其他的索引和实体化视图以加快报告的进度。
与管理备用数据库有关的许多任务也是自动化的,包括初始实例化、失败切换和轻松的主从之间的来回切换。管理员也可以可选地指定每个备用站点滞后生产环境的日志应用
Copyright @ 2001 Oracle Corporation All rights reserved.
第 29 页
Oracle 公司数据仓库系统产品介绍
延迟(目的是增强免除人为错误或损坏错误的保护),并选择一个零丢失模式,在此模式下重做日志被同步地发送到备用站点。
在 Oracle9i 中还增强了 LogMiner,以便为所有数据类型提供全面的日志分析。目前 LogMiner 支持索引编排的集簇表、链式行、LOB 和 LONG、直接加载、标量对象类型和 DDL。LogMiner 也显示主键并支持根据更改内容的日志查询(例如,显示对雇员“Smith”的所有更改)。一个新的图形用户界面以及其他数据库特性也使此产品既易学又易用。 联机数据演变
Oracle9i 包含一个新的联机重新组织和重新定义体系结构,此体系结构允许更为强大的重新组织功能。目前管理员可以对表定义执行各种联机操作,包括常规表的联机重新组织。在本质上,Oracle9i 目前允许一个联机“CREATE TABLE AS SELECT”操作。 在此新体系结构中,表的内容被复制到一个新表中。在复制内容的同时,对原始表的更新由数据库跟踪。在复制完成后,将更新应用于新表。一旦应用了更新,就可以在新表上创建索引。在创建索引后,将应用任何其他更新,而且结果表将替代原始表。在更新字典数据的同时,仅在操作开始和结束时以独占模式锁定表。
使用这一新的体系结构,表的任何物理属性都可以联机更改。可以将表移动到一个新位置,可以将表分区,可以将表从一种组织(例如堆积)转换为另一种组织(例如索引编排的)。
此外,许多逻辑属性都可以更改。可以更改列的名称、类型和大小。可以添加、删除或合并列。主要的限制是不能修改表的主键。
目前 Oracle9i 也支持索引编排表上次级索引的联机创建、重建等。目前可以联机创建索引并同时对其进行分析。次级索引支持块提示的有效修复。
管理员也能够快速地静默数据库以便执行不要求活动事务处理的操作。此外,在 Oracle9i 中可以动态调整缓冲区高速缓存和共享池的大小。最后,Oracle9i 也可以在对象处于联机状态并被用户访问的同时验证对象的结构(分析验证)。 准确的数据库修复
Oracle9i 包括对磁盘损坏的更好预防和改进的处理方法。万一块损坏需要通过介质恢复进行修复,一个新的块介质恢复特性在表的其余部分处于联机状态的同时仅允许恢复损坏的块。在恢复期间检测到日志损坏后 Oracle9i 能够将数据库还原到一致状态。LogMiner
Copyright @ 2001 Oracle Corporation All rights reserved.
第 30 页
Oracle 公司数据仓库系统产品介绍
允许在损坏之后检索并应用日志中的更改。尝试恢复允许恢复在检测到损坏的数据库块后继续进行,以便管理员可以确定损坏是不是一个孤立的事件。如果找到更多的损坏,则退出恢复。
Oracle9i 也可以通过使用新的两关口恢复算法更快地从崩溃恢复,此算法确保只有那些需要处理的块才从数据文件中读取和写入数据文件。一个新的基于时间的平均恢复时间 (MTTR) 参数也使对崩溃恢复时间设置极限更为容易。Recovery Manager 备份与还原操作目前可以在失败后停止之处重新启动。Oracle9i 也包括改进的可诊断性特性,以快速捕获失败例程的状态并允许失败状态上的恢复之后的诊断。对于多节点系统,Oracle9i 为 Oracle Parallel Server 提供更为快速的失败检测和重新配置,从而减少由于系统错误而引起的停机时间。通过使用 Windows 2000 的增强功能,增强了 Oracle Fail Safe for Windows,以利用多节点群集。这允许在多个节点上的多个数据库共享一个公共备份节点时进行配置,从而降低了为多个应用程序提供冗余的成本。 自助错误更正
Oracle9i 包含处理人为错误的非常强大的技巧。
Oracle9i 包含可以授权最终用户以更准确、更有效和更容易的方式更正其自身错误的功能。要更改错误,最终用户需要能够通过查看更改历史识别错误,并且他们需要能够通过将数据恢复为错误发生之前的数据来退出错误。Oracle9i 同时提供这两种功能。这两种功能在 SQL 级别上是可用的,以便应用程序可以像任何其他正常的 SQL 操作一样调用它们,无需管理员的干预。
Oracle9i 的 DejaView 特性允许从过去的某一点来查询数据。用户设置他们希望查看的日期和时间,然后他们所执行的任何 SQL 查询将对数据进行操作,就像数据存在于该时间点上。此新功能使用 Oracle 的多版本读一致性功能通过应用所需的撤消来还原数据。目前管理员通过仅指定在数据库中保留撤消的长度就可以配置撤消保留。通过使用 DejaView,用户可以查询数据库,就像数据库存在于今天早晨、昨天或上周。此操作的速度仅取决于正在查询的数据量以及需要退出的数据更改数。
通过使用 LogMiner,可以从日志中查询数据库的更改历史。目前 LogMiner 允许基于内容的数据过滤。例如,用户只能查询对客户 John Smith 的更改。此功能允许在行级别上查询更改历史。因为重做和撤消由数据库维护以获得内部一致性,所以启用这些功能不会添加开销。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 31 页
Oracle 公司数据仓库系统产品介绍
2. 强大的伸缩性和性能,强大的并行处理能力,支持复杂的,大数据量的、突发查询的能力
Oracle数据库具有很强的并发性,可以支持10000个以上的用户同时对数据库的访问,保证了数据仓库系统较高的并发访问能力。允许扩大到数千万用户,每个用户每小时都执行数百万事务处理。关键聚焦领域包括:
Oracle9i Real Application Clusters — Cache Fusion
Oracle9i Real Application Clusters可以使所有的应用程序不经修改便能获得集群数据库的高可用性、可伸缩性和高性能。应用程序可以将Oracle9i Real Application Clusters当成一个单一的系统使用,而不必再进行分区或修改,以获取类似集群数据库的可伸缩性。这允许用户随着应用及需求的不断增长,横向地伸缩数据库的级数,而不必对应用程序进行修改。而且,Oracle9i Real Application Clusters是自适应的,能够根据数据库负载情况的变化进行自我调节——动态地在集群服务器上移动数据库资源,以获取最佳性能。这种透明的可伸缩性和高性能由一种被称为Cache Fusion的革命性技术所提供。。 Oracle9i 高速缓存合并体系结构利用群集中所有节点的聚合高速缓存来满足数据库请求。目前既可以通过本地高速缓存也可以通过任一其他高速缓存来满足查询请求。这减少了磁盘 I/O。更新操作不要求用于同步化的磁盘 I/O,原因是本地节点可以直接从任一群集数据库节点高速缓存获得所需的块。仅在任一聚合高速缓存都没有必需的数据和更新事务处理执行磁盘写入保证的 COMMIT 操作时,才执行昂贵的磁盘 I/O。此实现有效地扩展了数据库高速缓存的工作集并减少了磁盘 I/O,从而大幅度提高数据库操作的速度。Oracle9i 高速缓存合并在读/读、读/写和写/写争用的情况下直接将数据块从一个节点的高速缓存运送到另一个节点的高速缓存。这建立在处理读/写争用的以前的 Oracle8i 高速缓存合并实现之上。因为 Oracle9i 中完全的高速缓存合并实现消除了与基于磁盘的高速缓存协调有关的等待时间,所以目前应用程序可以有效地扩大,而无需知道群集。这意味着第一次可以将群集视为一个真正可伸缩的单个系统。 可伸缩会话状态管理
新的共享内存功能、Java 会话支持的改进、联网和多线程服务器改进大大减少了 Oracle9i 上每个用户所需的覆盖区。 小粒度自动资源管理
Copyright @ 2001 Oracle Corporation All rights reserved.
第 32 页
Oracle 公司数据仓库系统产品介绍
在 Oracle8i 中引入的 Database Resource Manager 在 Oracle9i 中已经有了重大增强,以允许对资源的更多粒度控制并为客户组添加诸如自动客户组切换、最大活动会话数控制、查询执行时间估计和撤消池限额之类的特性。管理员能够指定每个客户组的最大并发活动会话数。一旦达到这一极限,Database Resource Manager 将对所有后续请求进行排队并仅在现有活动会话完成之后才运行它们。
Oracle9i 的自动客户组切换功能允许管理员指定某一准则,如果满足它,将导致 Database Resource Manager 自动切换一个长时间运行的客户组,例如,从为 OLTP 操作而建立的客户组到另一个适合成批报告的客户组。管理员也能够为每个客户组设置最大估计执行时间。然后 Database Resource Manager 在每个操作开始之前为操作估计大致的查询执行时间,如果此时间超过指定的极限,将终止该操作。利用撤消池限额特性,目前管理员能够为每个资源客户组生成的回退数据总量指定一个最大值。这将阻止一个“欺骗”事务处理消耗过多的回退空间并因而影响系统操作。 起关键作用的优化特性
对本地编译和改进的 PL/SQL 优化的支持提高了当今的许多应用程序的性能,通常有重大改进。将内存和 CPU 成本添加到基于成本的优化程序导致更好的优化计划,更少的资源使用和更快的总体性能。消除或减小了几个领域的栓锁争用,并提高了大型系统上的性能。一般的 I/O 改进,包括自身优化直接 I/O,预提取和索引上的跳过/扫描行源操作也提高了“数据仓库”和 OLTP 环境中的性能。
对于 Java,改进的无用单元收集,更好的本地编译,增强的对象共享和会话连接,所有这些都提高了内建在 Java 中、在数据库内执行的应用程序的性能。JDBC 和 SQLJ 性能改进也提高了中间层或客户机上的 Java 的性能。
在 Oracle9i 中通过提供 VI 支持,将服务器和客户机上用于网络通信的 CPU 利用率减少了 60% 多。虚拟接口 (VI) 是一个新出现的通信协议,用于群集的服务器环境。与 TCP/IP 不同,VI 是一个专门为群集环境设计的“瘦”协议,它将大部分消息传送负担置于高速网络硬件上,从而为更重要的任务释放 CPU 空间。
此外,特定的网络接口优化、改进的新虚拟线路 I/O 和统一的事件/等待模型,所有这些都大大提高了客户机/服务器的通信性能。对于超出的吞吐量达 20% 的多线程服务器环境尤其是这样。最后,Oracle9i 支持 LDAP 技术以便集中管理网络命名,不管客户有 1 个还是 100 个数据库都可以简化部署。Oracle9i 支持 Oracle Internet Directory、Novell Directory Services 和 Microsoft Active Directory。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 33 页
Oracle 公司数据仓库系统产品介绍
通过使用 OCI 来重做数据库/数据库通信提高了分布式数据库的性能。改进的分布式查询优化也已经内建到优化程序中。 列表分区 技术
Oracle9i新增一种分区策略-列表分区,从而大大加强了分区功能。这种新的分区策略为数据仓库管理员提供更多的选择,以取得可管理性和性能的最佳组合。尽管Oracle 预计大多数数据仓库系统采用平行分区,其它的分区策略(散列分区、在Oracle8i 中引入的综合平行与散列分区以及现在Oracle9i 中的列表分区)在某些数据仓库环境中或许有明显的优势。
分区列表使数据仓库管理员能够精确地控制数据属于哪个分区。对于每个分区,数据仓库管理员可为分区行的分区键指定一列可能值。
列表分区补充了平行分区的功能。平行分区对于沿着一个连续的区域分割一个表是有用的(更常见的是,表是由时间来平行分区,所以每个平行分区包括一个给定时间范围值的数据,如每月或每周一个分区)。相对来说,列表分区对于沿着一个离散的区域分割一个表是有用的。在列表分区策略中的每个分区都对应于一个离散值的列表。 3. 快速响应时间,高性能
数据仓库系统要求数据要以高度规格化方式进行组织,通过智能合计和查询间并行性使数据仓库变得更小来能提高查询性能。要充分考虑到统计、查询、分析、决策等各项功能的需要,要为复杂的查询提供最快的反应时间。
Oracle数据库中的多种处理优化机制,如并行查询、并行插入更新和删除操作、并行装载、并行索引建立、分区技术等等,加上具有丰富经验的数据仓库整体应用结构和硬件结构的合理设计、数据逻辑结构和物理结构的合理设计,保证了系统的快速响应时间。 对于数据仓库,首先必须满足最重要的性能要求。典型地,终端用户使用工具或应用程序来访问数据仓库。终端用户唯一能看到的数据库特性是性能:数据库以何速度处理某一指定查询的结果,并且将结果返回到用户所用的工具和应用程序。正是因为这个原因,对于采用数据仓库的数据库,性能是最重要的要求。 位图联合索引
Copyright @ 2001 Oracle Corporation All rights reserved.
第 34 页
Oracle 公司数据仓库系统产品介绍
“联合索引”是一种跨越多个表的索引结构,它改善了表连接的性能。从现状来看,Oracle8i 已经提供了一种广泛的机制来提高性能。而位图联合索引为更具体类型的联合查询,更进一步地提高了性能。
位图联合索引对于“星形查寻(star queries)”尤其有用。一些情况下,位图联合索引能提高30% 的查询性能。 自动内存调整
Oracle9i 为每个查询提供了一套自动的动态分配运行内存的机制。运行内存是一种在执行查询时,为特殊目的如排序和散列而分配的内存。在许多数据仓库环境中,数据仓库服务器有70% 以上的物理内存可被分配为运行内存。自动内存调整初看似乎就是一种可管理性。
然而,尽管自动内存调整毫无疑问地提高了可管理性,它的主要的优势却是在改善性能。自动内存调整不仅减轻了数据库管理员调整运行内存的负担,而且它的内存分配方法远比手动调整内存参数的分配法更精确。
通过自动分配运行内存,Oracle 将提高整个数据仓库的吞吐能力。在同样的性能水平上,数据仓库将支持更多的用户,因为数据仓库现在利用内存的效率更高。每个查询被分配的内存是基于它的具体要求,并且当运行查询时,Oracle9i 会动态地调整内存分配以确保高性能。自动内存调整的特点将保证那些内存需求量多的查询能得到足够的内存,而内存需求量少的就不会分配给太多的内存。通过更有效地使用内存,Oracle9i 提高了整体查询性能。
内部测试表明,此特性能提高内存绑定系统20% 以上的性能。并且,此特性易于实现(因为它仅仅涉及改变一些初始化参数)。 物化视图的增强
作为数据仓库一个基本特性,物化视图提供了一种机制,它能够提高几乎所有类型的查询性能。物化视图应看作是一种特殊的视图,它物理地存在于数据库中,可包含连接与/或集合,并且通过预先计算查询执行前费时的连接和集合操作,能够改善查询执行时间。 物化视图的增强也减少了查询的响应时间。目前,更多的查询能使用物化视图,因为他们能够建立基于数据子集(例如只有EMEA 和Asia 地区)的一个物化视图。由于大多数
Copyright @ 2001 Oracle Corporation All rights reserved.
第 35 页
Oracle 公司数据仓库系统产品介绍
视图现在能够采用快速的新方法,维护物化视图所需的时间减少。为了帮助管理和使用,可利用两个新的软件包,该软件包解释了为什么查询不使用物化视图以及软件包的功能。 在Oracle9i 中,物化视图在几个重要方面得到增强,这包括更复杂的查询改写机制如支持数据子集。 以及增强的更新机制即允许对更多的物化视图快速地、增长地更新。终端用户唯一能看到的数据库特性是性能:数据库以何速度处理某一指定查询的结果,并且将结果返回到用户所用的工具和应用程序。因此,性能对于数据仓库中的数据库极为重要。
对更多的SQL 语法的支持
完整外联合 :Oracle9i 支持完整外联合。以前,Oracle 仅支持单方外联合。Oracle9i 支持ANSI 连接语法,完全支持单方和完整外联合。这个特性既提高了复杂查询的性能,又简化了用SQL 表示复杂商业问题的任务。
WITH 句型 :Oracle9i 还支持WITH 句型。这种新的SQL 结构能提高复杂的、在多处使用同一子查询的SQL 查询的性能。
适应的直接IO 操作 :自Oracle7,Release7.1(1993年)以来,Oracle 就已经支持IO 操作。直接IO 操作通过绕过缓存的方式提高表扫描、索引扫描和大容量写的性能。进一步提高性能的方法是采用异步IO 操作(自Oracle7 Release 7.3 就已开始支持)。在Oracle9i 中,这些IO 操作得到了进一步的增强。通过动态调整IO 缓冲区的数量来确保异步直接IO 尽可能有效地执行,Oracle9i 将更有效地利用异步直接IO 操作。
4. 强大的复杂查询技术
当需要访问大量的存储数据时,成功的数据仓库应用对性能的依赖非常大。Oracle提供了丰富的集成的索引机制和连接方法,使结果能够迅速到达数据仓库的用户手中。 位图化索引(Bitmapped index)为数据库应用带来了巨大的性能收益。位图化索引(Bitmapped index)被充分集成进Oracle Server中,并和其它一些如标准B-树索引,聚族索引(clusted table)和哈希聚族(hash cluster)索引等相共存和兼容。虽然B-树索引可能是使用单个标识(unique identifier)进行查询时最有效的,然而,当使用范围非常广的查询条件进行查询时,如“上个月一共售出了多少辆红色轿车?”,位图化索引(Bitmapped index)是最为有效的。在数据仓库应用中,最终用户总是基于这类范围非常广的查询条
Copyright @ 2001 Oracle Corporation All rights reserved.
第 36 页
Oracle 公司数据仓库系统产品介绍
件进行查询。Oracle通过使用数据压缩技术解决了位图化索引(Bitmapped index)的高效存储。并行索引创建(parallel index creation)和支持更新操作的自动索引维护使维护工作变得更为简单容易。
哈希联接(hash join)在许多复杂查询情况显示出比其它联接方法高得多的性能,尤其适用于那些在联接处理时现有的索引技术力不从心的查询,这种现象在一些有特殊要求的查询环境中经常发生。Oracle提供的哈希联接(hash join)避免了进行排序的需要,因为使用了在内存中完成的运行时哈希表创建。理想情况,它们同样适用于可伸缩的、并行的执行。
除了提供了对大型数据库的管理能力外,分区(partitioning)同样也提高了查询性能。分区忽略(Partition elimination)降低了查询必须要考虑的数据数量,从而,提高了性能。 具有对复杂查询进行优化的能力
5. 高可扩展能力
建设数据仓库系统是一个长期的大型项目,因此,我们一定要保证系统具有广泛的适应性和可扩充性,可以根据规划分期分批建设。要求必须有很强的扩充能力,逐步升级和扩充,以保持系统的连续性,避免出现重构数据仓库系统的事件。
Oracle数据库系统具有很好的扩展性,Oracle数据库可运行在各种SMP、MPP硬件平台上,当硬件平台扩展时,可充分利用硬件平台的处理能力。建立在Oracle数据库上的数据仓库随之具有扩展能力。
Oracle数据库对于系统的数据容量基本没有限制,但数据大量扩展时,要考虑系统的I/O性能;通过利用高I/O性能的存储系统及合理的数据库结构的设计,满足系统的数据扩展性要求。
Oracle9i 也提供增强以改善内部节点并行查询的性能。内部节点的并行查询是用于通过使用实应用程序集群(Real Application Clusters),查询成簇的或大量的并行处理器(MPP)的硬件配置,在这里一个简单的查询在多个硬件节点上被并行处理。 这两方面的增强本质上都是在内部,因此对Oracle 现有的性能有极大的提高。 6. 支持大容量,TB级的数据存储能力
Copyright @ 2001 Oracle Corporation All rights reserved.
第 37 页
Oracle 公司数据仓库系统产品介绍
Oracle数据库支持大容量,突破数据规模限制。 记录数据量大: 数据表大小无限制。 数据库容量达到512PB。 适应数据量高速增长。
记录内容复杂:每个表最多达1000个字段。
Oracle数据库数据分区技术,管理分区和索引,可以根据业务需要将表和索引按条件分区,分区对应用透明,分区可以显著提高访问大表时的性能。 指标 数据库大小 数据库文件数 每个表的列数 每个表的行数 列长度: char:varchar 索引列 7. 高安全性
客户的数据仓库系统必须提供一套广泛而严密的安全机制,确保数据在存放、备份、传送和使用等环节上的安全性;要有大量的备份及恢复程序来减少数据丢失的可能性,具有灾难备份的功能;建立完善的操作人员授权机制把数据通过授权的方式保护起来,设立数据存取等级;对敏感数据的传输要进行加密,以防止数据被破坏、窃取;要有严密的措施来防范非法入侵。另外,对数据的操作在日志文件里也都要有记录以便于日后进行跟踪。
Oracle8i 512 Petabytes 64-256M 1000 Unlimited 2000bytes:4000bytes 32
Copyright @ 2001 Oracle Corporation All rights reserved.
第 38 页
Oracle 公司数据仓库系统产品介绍
系统的安全性首先包括对系统数据访问的安全性。Oracle基于角色的安全控制通过灵活及易于管理的授权方式,保证了数据访问的安全性;另外还可以通过视图、数据库触发器等实现特殊的数据安全性;Oracle数据库的审计功能还可跟踪记录系统的各种操作,用于查找可疑的操作。
对于因系统、介质故障引起的数据损坏,通过Oracle提供的各种备份恢复方法来恢复数据,如数据库物理备份、逻辑备份、容灾备份等等。
另外数据仓库系统还可以利用网络、操作系统的安全控制来实现其综合的安全性要求。
8. Oracle开放式网关提供异种数据源访问技术
Oracle开放式网关技术能把多种数据源集成为一个覆盖企业范围的数据环境,使得应用程序能不做任何修改就可以运行在非Oracle数据源之上。开放式网关包含两个部分:Oracle透明网关和Oracle过程化网关。您可以利用Oracle透明网关中的Developer's Kit自已构造访问远程数据源的网关,也可以利用Oracle过程化网关中的 Developer's Kit,采用PL/SQL过程调用,构造自已的网关访问远程数据源。透明网关提供的是非过程化的,以SQL语言访问非Oracle数据集的方法。Oracle过程化网点能利用开放的或不开放的系统界面,把事务处理软件、操作系统、远过程调用与外部应用系统连接起来。Oracle数据库作为系统集成平台,由它来管理对多服务器及网关之间的通信。开放式网关能将非Oracle数据源与Oracle的数据类型进行动态地相互转换。 Oracle Transparent Gateway (透明网关):
采用Oracle的SQL语句透明存取非Oracle数据库中的数据,所支持的非Oracle数据库有:DB2、RMS、SQL/DS、IMAGE/SQL、SQL/400、Informix、Sybase、Ingres等。用户还能利用Transparent Gateway中的Oracle Transparent Gateway Developer’sKit构造自己的非过程化网关,连接其它非Oracle数据源。利用透明网关技术,Oracle 将作为各种数据源的集成库,由Oracle来存取及调用各种数据源的数据,并实现透明的分布式查询,透明的分布式修改,非Oracle数据源还能参与两阶段提交及分布式复制过程,并实现各种数据源的节点自治。透明网关有以下几种:
Transparent Gateway for IBM DRDA Transparent Gateway for SQL/400
Copyright @ 2001 Oracle Corporation All rights reserved.
第 39 页
Oracle 公司数据仓库系统产品介绍
Transparent Gateway to DB2 Transparent Gateway to RDB Transparent Gateway to RMS Transparent Gateway to IMS
Transparent Gateway for IMAGE/SQL Transparent Gateway for Informix Transparent Gateway for Sybase Transparent Gateway for Ingres
Oracle Procedural Gateway (过程化网关):
利用PL/SQL书写据库的远过程调用(RPC)命令,来存取非Oracle数据库中的数据,或非Oracle的应用程序。用户还能利用Oracle Procedural Gateway中的Oracle Procedural Gateway Developer’s Kit构造自己的过程化网关, 连接其它的非Oracle数据源。过程化网关有以下几种:
Procedural Gateway for CICS Procedural Gateway for APPC
9. 易于管理
对于数据仓库系统的维护,Oracle提供了图形化的易用的维护管理工具OEM(Oracle Enterprise Manager),备份恢复工具RMAN(Recovery Manager)等,使维护工作变得方便;另外在数据仓库的开发中为数据仓库定制的维护程序,将使一些维护工作自动化。 Oracle Enterprise Manager是一套开放的综合系统管理系列产品,它包括了下一代系统管理工具,可以高效地管理整个Oracle环境,包括系统、数据库、网络和应用程序,可以大大减少系统管理员用于管理复杂产品环境的时间。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 40 页
Oracle 公司数据仓库系统产品介绍
Oracle Enterprise Manager的开放且灵活的体系结构由一个中央控制台、公共服务和在被管理节点的智能代理组成,控制台为Oracle环境提供了一个集中控制点,而公共服务提供了作业调度系统和一个事件管理系统。作业调度系统让管理员可以调度远程站点的重复作业,例如数据库备份或生成报告,使“关灯(light out)”系统管理成为可能。事件管理系统可以监视中心或远程站点的特定事件,在检测到问题时能向管理员报警,或者采取自动的更正措施。
在控制台之上运行的集成数据库管理员应用程序包含有工具用于处理用户和组管理、存储管理、备份/恢复导入/导出、和数据加载,还包括Oracle Software Manager,它可以分发和安装Oracle和非Oracle的软件,并可以进行版权(License)和资产管理。这些建立在Oracle Enterprise Manager体系结构上的应用软件是集成化的,它们都具有共同的外观效果,能够利用由控制台提供的公用的服务。这将大大缩短系统管理员(DBA)的学习时间,减轻工作的复杂程度,提高工作效率。
Oracle Enterprise Manager Console由四个主要的部件组成,它们是Navigator,Map Window,Job Scheduling System和Event Management System。
Navigator包含一个对象的浏览器,使用它可以查看所有的网络和服务。Navigator简化了基本的用户和小组的管理任务。在Navigator中,有系统中所有对象的树状列表,通过使用列表使得对象操作十分简便易行。对象包括结点、数据库、收听者、用户、角色以及Profiles。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 41 页
Oracle 公司数据仓库系统产品介绍
Map Window为主要对象提供了定制的图形化的表示,这些图形化表示由系统管理员生成,主要用于管理和监测中对象的子集。对象可以按照任何的标准进行组合,这样简化了需要对小组内所有的成员都执行的操作。
Job Scheduling System允许系统管理员让需要反复执行的数据库任务自动的执行。日常的一些任务(如,数据库备份)能够定期地被调度执行,这有助于系统管理员将更多的时间集中用于能够增值的任务。Job Scheduling System可以将作业调度到远程的站点上执行,提供“lightsout”类型的管理,这在大型的分布环境中是至关重要的。
Event Management System允许系统管理员对数据库和系统的事件进行远程地监测,并且提供了依赖于事件的严重级别的过滤机制。Event Management System提供了设置阈值的功能,并且能够与Job Scheduling System完美地协调工作,当指定的事件发生之后,自动地开始执行正确的作业。系统管理员能够定义对哪些事件感兴趣,并且当检测出事件发生之后,在Console上给出图形化的表示。Event Management System还能够以电子邮件或寻呼的形式通知系统管理员某事件的发生。
Oracle Enterprise Manager Intelligent Agent是运行在所有的被管理的数据库服务器上的一个进程。它的执行效率非常高,但是并不直观,它的作用就是负责控制台发出的任务及事件的执行。它支持简单网络管理协议(Simple Network Management Protocol,SNMP),因此第三方厂商的应用软件利用这个协议作为与Agent进行通信的一种手段。Agent还提供对Oracle的SGA的直接访问,这是一个效率更高的收集Oracle统计数据的方法。Oracle Enterprise Manager Intelligent Agent的功能的实现与Consoled网上的联机状态无关,这保证了数据库的高有效性。
Oracle还为管理Oracle产品系列的不同的产品(如,Oracle Mobile Agents,Oracle Parallel Server等)提供了相应的管理应用软件。
Oracle Enterprise Manager的开放的体系结构通过一些公共的应用编程接口,为客户和第三方厂商提供了在多个层次上进行集成的条件。 Oracle Diagnostics Pack
Oracle Diagnostics Pack是用于监控Oracle数据库环境、诊断系统问题和安排未来计划的一套高级工具集。它包含5个应用模块:
提供一组客户自定义的性能监控图,用于对数据库的运行情况做实时、图形化的监控界面。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 42 页
Oracle 公司数据仓库系统产品介绍
定时自动收集相关的性能数据,并对数据进行分析处理,以诊断问题所在,并对将来做调整规划。
对远程节点和服务器的事件进行监控和预警。 审计、跟踪数据库及其它产品触发的事件。
对出现问题的高优先级数据库会话进行识别、诊断,并排除故障。 Oracle Tuning Pack
Oracle Tuning Pack主要用于优化和调整数据库的运行效率,如SQL的优化、索引策略、控制I/O进程参数、排序、对象的组织和存储等等。 Oracle Change Management Pack
Oracle Change Management Pack是一套附加的工具包,它可以帮助用户对数据库以及数据库里面的数据对象进行复杂的修改工作。Oracle Change Management Pack由七个主要的功能模块:
DB Alter DB Capture DB Diff DB Propagate Plan Manager DB Quick Change DB Search
这些工具允许您对用户对象做复杂的修改(如改变表或索引的表空间等),可以跟踪对数据库和用户所做的任何修改,复制用户对象,以及在数据库和用户之间做比较和同步工作。
10.Oracle 9i高度集成
Copyright @ 2001 Oracle Corporation All rights reserved.
第 43 页
Oracle 公司数据仓库系统产品介绍
对数据仓库和商务智能来说,诸如OLAP、ETL 和数据挖掘这些技术几乎都不是新事物(的确,这些受争议的技术先于数据仓库产生)。数据仓库的从业者好多年前就能购买到有这些性能的产品。然而,典型的OLAP 产品有自己的计算引擎和数据存储,ETL 产品有自己的转换引擎,数据挖掘产品也有自己的挖掘引擎。简言之,商务智能软件产业正维持着至少四个‘数据引擎’,而每个都需要它自己的基础设施和管理数据的工具、可用性和恢复策略、安全机制、并行机制和可伸缩的基础设施。因此许多产品在一个或多个领域缺乏稳健性,这是不足为奇的。此外,这些产品并不完整,而一个完整的商业智能系统需要这些资源来实现和管理大量的服务器产品。
为了能满足商务智能平台的要求,Oracle 已扩展了关系型数据库的性能和语言(SQL),并且Oracle 在Oracle9i 之上引入了两种新的基于Java 的APIs 来支持OLAP 和数据挖掘的专门要求。
下面三部分简要介绍了Oracle9i 在支持这些新领域的增强。 1) OLAP
(OLAP)功能的关系数据库,它提供了对OLAP 查询处理的高效解决方案而没有增加管理的复杂性。Oracle9i OLAP 是Oracle9i 企业版的一个选件,通过使用那些先前专门化的OLAP 数据库中才有的特征,它提供了对商业运作和市场的深刻洞察。由于Oracle9i OLAP 完全集成到了关系数据库中,因此所有的数据和元数据的存贮和管理都是来自Oracle9i 提供的超强的可伸缩性、稳健的管理环境和具有行业标准的可用性和安全性。Oracle9i 中有一个新的API 即Java OLAP API,它提供了复杂的多元查询的表示方法,并且它被设计来构造因特网环境下的OLAP 应用程序。Oracle 商务智能(BI Oracle9i 是第一个,且唯一的一个具备联机分析处理)Beans 和Oracle JDeveloper (Oracle9i Developer 套件的两部分)提供了一个在Oracle9i OLAP 之上的、完整而高效的开发环境。
OLAP API
Oracle9i 的Java OLAP API 从开始就是为Java 和Internet 设计的。使用Java ,程序的开发者能写出应用程序、applets 和servlets 。它们能为大量的分布式且使用多种设备的用户团体提供部署Internet 应用程序的方法。
Oracle9i 的OLAP API 是一个面向对象的Java API ,它能提供如下关键优势:
设计的初衷就是支持Internet应用程序
Copyright @ 2001 Oracle Corporation All rights reserved.
第 44 页
Oracle 公司数据仓库系统产品介绍
面向对象:提供封装、抽象和继承 利用多维元数据模型 提供多维游标
支持完整的OLAP 计算函数集
为表示复杂OLAP 计算提供一个简单的机制(用SQL 表示可能不容易) Oracle 的商务智能Beans 是用Oracle9i Java OLAP API 构造的。 支持OLAP 新的关系特性
使用Oracle9i OLAP,所有的数据都驻留在关系数据库中,并且绝大多数计算非常适合采用SQL。在Oracle8i 的特性中,如位图索引、星形查询优化和物化视图,引入了许多关键因素,他们可确保使用SQL(如快速的单元访问、高效的集合以及摘要数据的管理)进行成功的OLAP 处理。
然而,为了满足OLAP 苛刻的要求,Oracle9i 在SQL 功能和性能上都包含了一些实质性的增强。特别地,Oracle9i 为新类型的分析函数提供了一个广泛的SQL 性能集合,此外它对集合也有实质性的增强。 SQL分析的增强
Oracle9i在较早发布的Oracle8i基础之上建立了分析功能,它包括的计算主要用于:
排序(“寻找每个地区的前十名销售代表”) 移动窗口集合(累计的总和和移动平均数)
时间段的比较(“从1999年1月到2000年1月的增长百分比是多少?”) 报告比率(“一月份的销售额占全年的百分比是多少?”) 统计功能(线性衰退,线性相关) Oracle9i 另外提供SQL支持:
Copyright @ 2001 Oracle Corporation All rights reserved.
第 45 页
Oracle 公司数据仓库系统产品介绍
倒转百分点——这些功能允许查询,以找到与指定百分比值对应的指定数据。例
如,用户能通过查询找到数据集的中值。
PERCENTILE_DISC(0.5)
假定的排序和分布状态——此功能允许查询,假定数据值被加入到现有数据集
时,其序值或百分比值是什么
记录典型OLAP操作的需求
柱状图——此功能创建一个宽广平稳的柱状图。对每个数据行返回一个描绘数量
的柱数。
FIRST/LAST集合——允许一组里的首位或末位元素与任意元素比较。例如,此
功能能够计算月首余额与当前余额差。
SQL 集合的增强
集合也是OLAP(联机分析处理)操作中的一个重要组成。在Oracle8i中,集合是随着运算符CUBE和ROLLUP的增加而增强的。这些运算符是SQL GROUP-BY 功能的延伸,使得一条单一的SQL查询语句能够计算不同层次的集合。Oracle9i 引入“分组集合”,进一步扩展了这个功能。这个特性允许一条SQL查询语句查询任一指定集合的层次。通过术语GROUPING SETS 和关键字GROUP BY 以及一栏说明列表,很容易指定分组集合。
分组集合通过“连锁分组集合”的概念得到进一步增强。连锁分组集合能更为简捷地产生大型的分组联合。连锁分组集合指定的分组从每个分组集合产生交叉产品。交叉产品操作使得更小的连锁分组就能产生大量的最终分组。 2) 数据挖掘
Oracle9i数据挖掘是Oracle9i企业版的一个选件,允许各公司建立高级的商业智能化应用,对公共的数据库进行采集,洞察新事物并整合到商业应用中去。
Oracle9i 数据挖掘将数据挖掘的功能嵌入到Oracle9i 数据库中,以便进行分类,预测和协作。
Oracle9i数据挖掘允许应用程序开发商将数据挖掘功能整合到他们的商业智能化应用中,以支持以下活动:
Copyright @ 2001 Oracle Corporation All rights reserved.
第 46 页
Oracle 公司数据仓库系统产品介绍
预防客户间摩擦 对现有客户交叉销售 获得新用户 查处假货 识别大客户 精确描绘客户需求
Oracle9i数据挖掘与关系数据库完全集成。所有的模型建立,记录和元数据管理操作完全通过基于java的应用程序接口初始化,并且完全发生在关系数据库范围内。 数据挖掘API(数据挖掘应用程序接口)
应用开发商通过基于Java的API使用Oracle9i 的数据挖掘功能。数据挖掘的程序化控制能自动准备数据、建立模型和记录模型运行。Java 数据挖掘是继Sun的java 说明要求Java Community Process之后的新型数据挖掘标准。Oracle9i 数据挖掘API 为Java 数据挖掘提供了初期概念和方法。一旦此标准出台,Oracle9i 数据挖掘会遵照这一标准。 Oracle9i 数据挖掘直接依照关系表,执行数据库内所有的数据挖掘操作。 预见和分类:Naive Bayes
Oracle9i 数据挖掘为预测和分类,提供Naive Bayes数据挖掘算法。这个算法可适用于各种数据挖掘问题并提供高精确度。各公司可以利用数据中发现的模式,预测那些具有相似性的客户们的未来举动——根据过去预测未来。典型的预测应用是预计某一成果的可能性。例如,公司的管理系统要得知需求方对某一报价的种种可能反应。Naive Bayes算法能估计概率,根据这些概率,公司可将目标定在最快反应的客户身上。 发现协作伙伴:协作规则
Oracle9i 数据挖掘提供协作规则的数据挖掘算法,以发现那些隐藏在数据库中的相关或并发事件。协作分析经常用于发现常见的问题(如菜篮子分析),例如“牛奶”和“谷类”就和“香蕉”相关。协作还可用于识别产生的并发事件,例如:
什么生产部件和设备安装与失败事件有关?
Copyright @ 2001 Oracle Corporation All rights reserved.
第 47 页
Oracle 公司数据仓库系统产品介绍
哪种患者和药物属性与哪种结果有关? 哪项产品是人们最可能喜欢和购买的?
协作能预见购物筐中下一个商品,有利于满足顾客需求, 提高平均订单量。
一旦专用服务器进入了主要的商业智能化应用,Oracle9i 数据挖掘便为集成复杂的数据挖掘技术打开了大门。 3) 提取,转换,装载
Oracle9i提供了一套完善的服务器功能来满足典型的ETL(提取,转换,装载)过程需求。这个功能着重于提供一个可伸缩的ETL基础设施,允许大量的数据进入数据仓库。Oracle提供一个ETL特性工具包,满足ETL进程的各个方面,这些特性包括: 外部表
外部表特性允许诸如普通文件的外部数据在数据库中出现,就象常规表一样。外部表能通过SQL访问,这样也可通过运用SQL,PL/SQL 和JAVA的强大功能,直接或平行查询外部文件。
Oracle9I通过平行的多重转换,为数据库提供数据流功能;Oracle9I 是一个可伸缩的,功能丰富的ETL引擎。
运用SQL,PL/SQL 和JAVA的强大功能,外部表通常用于ETL处理,将数据转换(通过SQL)和数据装载合为一步。由于ETL中许多可能的应用程序和其他可处理普通文件的数据库环境,外部表是一个强有力的工具。 更新和插入功能
MERGE是一个新型数据操纵语言(DML命令, 允许一行(一批或多行)有条件的修改或插入,也就是“更新插入”。一个公共数据仓库要接收一批数据,有的是修正以前的数据行(更新),有的是新数据行(插入)。MERGE命令能用一个SQL命令处理这两种类型的行。MERGE的优势是改善性能,因为只用一个逻辑操作,而不是独立的修改和插入命令。就能完成这些DML操作, 多表插入
Copyright @ 2001 Oracle Corporation All rights reserved.
第 48 页
Oracle 公司数据仓库系统产品介绍
多表插入允许数据插入多个目标表中。SQL 谓词控制每一个目标表中插入哪行数据。例如,多表插入命令能将未定的销售订单插入到从已完成的销售订单分离出来的表中。正如更新插入特性,多表插入的主要优势是改善性能;一条多表插入语句比多个单表插入语句执行得更好。 表函数
数据转换可能有意想不到的复杂性。因此,为了实现不能用SQL 完成的转换,因而提供一个能扩展的框架。Oracle9i’s 表函数支持流水线式和并行执行转换,该转换是用PL/SQL、Java、C、C++ (Oracle9i 所能支持的任何语言)实现的。
上述的每个特性不仅扩展了Oracle 服务器的ETL 处理功能,而且由于所有的这些操作可能是完全并行的,每个特性还侧重于可伸缩性。相对于现在其它一些可用的ETL 的替代解决方案,可伸缩性是Oracle9i 提供的一项最重要的优势。
这些ETL 特性都特别有用,因为它们能彼此关联使用。例如,一个简单的SQL 操作可能是,使用外部表特性从一个普通文件中选择数据,把这个文本文件数据加入到数据库中其它的查询表,使用表函数来应用另外的复杂转换,然后把结果插入多个目标表中。所有的这些操作都是并行的,并且是用一个简单的SQL 语句。总之,Oracle9i 提供了这种通过多个并行的数据转换把数据汇入数据 库的能力。Oracle9i 是一个可伸缩的、功能丰富的ETL 引擎。
Oracle数据仓库设计和建立工具--Warehouse Builder
Oracle Warehouse Builder(以下简称OWB)是Oracle公司于1998年宣布的一个用于帮助企业构建数据仓库的集成工具。OWB将从前各自分离的产品提供的功能集成到一个公共的环境。这些功能包括:数据模型构造和设计、数据提取、移动和装载(ETT)、元数据管理、分析工具的整合以及数据仓库的管理。OWB提供了一个框架将数据仓库的各个部分包括关系数据库服务器、多维数据库服务器和前端分析工具相结合,从而产生了一个紧密集成、全面的数据仓库和商业智能(BIS)解决方案。
OWB减少了企业建设数据仓库的时间、成本和工作量。开发项目小组成员现在可以在一个单一的环境来实施和管理复杂的数据仓库系统。 OWB具有如下特点: 1. 全面的数据仓库功能
Copyright @ 2001 Oracle Corporation All rights reserved.
第 49 页
Oracle 公司数据仓库系统产品介绍
与其它工具不同,OWB更适合具有智能的数据仓库的特殊要求。从它的设计和生成功能到从多个来源提取数据和向目标数据仓库装载数据,OWB 的每一个方面都降低了企业数据仓库项目的复杂性。 2. 强调数据仓库的管理
目前市场上的很多数据仓库工具产品往往只强调数据仓库的生成过程,而忽略了对数据仓库进行管理的需要。OWB在提供强大的数据仓库生成功能的同时,更强调对企业数据仓库的管理。需要指出的是,OWB的管理功能可以被集成到Oracle Enterprise Manager(OEM)中,从而为提供一个无缝的企业管理工具。 3. 支持复杂的提取、转换和传输(ETT) 过程
OWB通过Oracle提供的透明网关技术,支持从Oracle数据库、ODBC数据源和大型主机系统中快速提取和有效装载数据。OWB还支持多种类型的数据转换方法,并能对转换过程进行记录(log),从而不断强化定义的商业规则,保证被转换和装载数据的完整性。
4. 利用数据库服务器提高性能
Oracle一直不断地改进和提高其业界领先的数据库产品。Oracle 在与数据仓库相关的一些主要方面提供了新的功能。OWB充分利用了Oracle 的新功能:汇总管理、数据分区和索引能力。
5. 与前端分析工具紧密集成
数据仓库的真正作用在于信息的分析,数据仓库的构建工具只有同前端分析工具集成,才能称为完整的平台。OWB支持专用于分析的多维模型,可以生成符合标准的元数据(MetaData),可以和复杂的分析工具如Oracle Express、Discoverer相集成。 6. 开放、可延伸的框架
OWB提供软件开发包(SDK)供客户和合作伙伴使用,通过使用SDK可以很方便地扩展OWB的功能,定制客户化的数据转换程序。SDK包括对外公开的API和一个开放的数据模型,第三方厂商可以很方便地将自己的应用与OWB相结合。 Oracle Warehouse Builder由下列这些主要部件组成: 1. OWB Repository
Copyright @ 2001 Oracle Corporation All rights reserved.
第 50 页
Oracle 公司数据仓库系统产品介绍
OWB Repository包含遵循Common Warehouse Meta data标准的元数据,OWB元数据用于建立数据仓库,提供和Oracle数据库服务器,Express Server以及Discoverer的集成。
2. OWB User Interface
一个图形化,采用面向对象技术,基于Java的框架,实现从任何平台管理数据模型建立和数据仓库环境的快速构造。 3. OWB Warehouse Administrator
和Oracle Enterprise Manager集成,管理工作流和数据仓库建立以及数据读取的全过程。
4. OWB Software Development Kit
使用SDK,用户和合作伙伴可通过集成他们自己的数据抽取程序实现OWB功能的扩展。
Oracle应用服务器-- Oracle Internet Application Server
Oracle Internet应用服务器提供了一个开放标准的架构,是开发部署Web上的应用的理想平台。它的伸缩性,分布架构和高度数据库集成是支持关键事务、交易型应用和数据仓库的基础。
Oracle iAS由四部分服务组成:通讯(Communication Services)、表示(Presentation Services)、商业逻辑(Business Logic Services)和系统(System Services)。Oracle iAS还包含了一系列的开发工具:Forms、Reports以及Discoverer。 1. 通讯 (Communication Services)
处理Oracle Internet应用服务器收到的请求,一部分请求直接由Oracle HTTP Server处理,其余的送至应用服务器处理(IIOP、RMI、Net8请求)。Oracle iAS可以支持移动WAP技术。
Oracle HTTP Server(Powered by Apache)
Oracle HTTP Server是基于Apache Server建立的,接收请求,处理或分派请求。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 51 页
Oracle 公司数据仓库系统产品介绍
Oracle HTTP Server Modules (mods)
HTTP Server的插件,扩展其功能。提供内部服务或分派请求到外部进程。Oracle增强可标准的插件并添加了Oracle的专用插件。
mod_plsql mod_ssl mod_perl mod_jserv
2. 表示(Presentation Services)
实现输出图形化的表示界面。支持scripts、Java servlets or Oracle Portal services。 Portal Services (Oracle Portal)
建立和管理门户的工具和运行环境。提供Internet门户引擎和自助的Web开发工具。 Apache Jserv
完全兼容Sun Microsystems’ Java Servlet 2.0 API标准的Java Servlet 引擎。 Oracle JSP
JavaServer Pages(JSPs)翻译器和运行引擎。OracleJSP支持SQLJ、NLS和附加标记库。 PL/SQL Server Pages (PSPs)
类似JSPs,由PL/SQL实现而不是由Java实现。Oracle PSP包括PSP编译器和PL/SQL Web工具箱。支持在HTML中嵌入PL/SQL。 Perl Interpreter
Oracle HTTP Server内置的Perl的运行环境,节省执行Perl scripts时启动外部解释器和进行IPC调用的工作。
3. 商业逻辑 (Business Logic Services)
Copyright @ 2001 Oracle Corporation All rights reserved.
第 52 页
Oracle 公司数据仓库系统产品介绍
Oracle iAS提供了多种方法开发商业应用逻辑,如:Java开发技术(J2EE、EJB,以及Oracle Java商业元件,面向GUI的方法如Oracle Reports和Oracle Forms)和模块驱动技术。Oracle iAS中的Java引擎为Oracle8i JVM。 Oracle Business Components for Java
BC4J是100% Java、支持XML以数据为中心的Java应用的运行框架。能够提升开发效率,易于推广,方便多层应用的客户化,可重用的商业元件。 Support For The Java Development Model (J2EE)
高可扩展的Server-Side的Java平台,支持J2EE、Corba和数据库存储过程的企业级的100% Java兼容的server环境。 Oracle8i PL/SQL Engine
执行PL/SQL存储过程、PL/SQL web应用和PL/SQL Server Pages (PSPs)的可扩展的环境。可以运行在后台Oracle数据库后台进程中,或者中间层Oracle iAS中。 Oracle Forms Services
Oracle Forms Developer应用的运行环境,包括一个Listener和一个运行引擎。 Oracle Reports Services
Oracle Reports的运行环境,以HTML或者PDF格式发布Reports到Web上面。 Discoverer Viewer
使用户可以通过web浏览器实现动态的、特别的查询和分析。
Oracle即席查询分析工具--Oracle Discoverer
Oracle Discoverer是直接基于数据仓库关系型数据库进行分析的ROLAP工具.以下简要介绍Oracle Discoverer的一些技术特点。 1. 超乎寻常的易用性
Copyright @ 2001 Oracle Corporation All rights reserved.
第 53 页
Oracle 公司数据仓库系统产品介绍
由于在开发过程中进行了广泛的使用测试,以及最终用户自始至终的参与,因而在今天的市场上,Oracle Discoverer被公认为最易于使用的随意查询、报告和分析工具。用户通过使用先进的循序渐进wizard界面,能够即刻访问信息。广泛的帮助、cue card和针对行业特点的计算培训,为用户提供了额外的帮助。
基于服务器的精巧的End User Layer,使得用户完全感觉不到数据库和SQL的复杂性。将复杂条件作为最终用户层的一部分进行存储,使得用户在不需要理解SQL下就能即该访问信息。使用强大的集成图表生成工具,能比数字更直观地显示数据趋势和异常情况。在图表中进行深入,能够更加清晰地审视特定趋势。 2. 为数据仓库提供的性能
Oracle DiscovererTM为客户机和服务器两端的随意查询、深入和旋转,都提供了最佳性能。使用专家SQL查询引擎能够动态地生成性能优化的SQL查询。非锁定查询允许在一个查询执行的时候,其它任务也能够运行,从而提高了最终用户的工作效率。数组获取数量的增加能够提供即刻的反应时间,同时降低了网络流量,从而减少了用户使用时的效率。 3. 资源控制
如同其它所有工具一样,Oracle Discoverer提供了一个资源管理器,它能够停止长时间运行的查询,控制资源使用效率。而且,Oracle Discoverer提供了独特的查询预测能力,它能够在你运行查询之前,告诉你查询所需时间。使用户能够直接控制,对需要运行的查询进行选择。 4. 自动汇总重定向
在数据仓库中,为了提高性能特性,大量数据都是预先汇总的。当你需要从一个大型细节性表中获得信息时,Oracle Discoverer能够自动地(也是透明地)将你的请求重新定向到预汇总表中。Oracle Discoverer通过使用一个精密的算法,不需要你的查询请求和所使用的汇总表之间完全匹配。借助于先进技术,它能够使用两者之间存在的最接近的匹配。并且在相应序列中无缝地进行累加。通过使用这种独特的功能,能够削减你需要的汇总表的数量,并且根据重要性次序建立和改善了查询性能。 5. ResultBase结构
Copyright @ 2001 Oracle Corporation All rights reserved.
第 54 页
Oracle 公司数据仓库系统产品介绍
ResultBase客户机立方体缓存对检索数据进行了压缩,并且建立了索引,从而在不重复访问数据库服务器的情况下,能够在客户机上进行迅速深入和旋转。Oracle Discoverer利用了Oracle的位图索引和星型查询能力,进一步支持数据仓库应用。 6. 灵活的数据仓库搜索能力
使用Oracle Discoverer任意深入和旋转能力,能够搜索数据仓库中的信息。Oracle Discoverer中的深入结构允许你通过切割数据,以不同方式查看结果,从而使你看到一幅全面、准确的企业全景。 7. 低维护的最终用户层
使用管理版产品部件中直观、基于Wizard的界面,能够使查询建立和分析对于最终用户变得更加简单。 8. 单按钮安装
最终用户层的设置和随后的维护工作是最少的,而且节省时间。这是由于大量的缺省设置和单按钮安装的原因。 9. 基于服务器的可伸缩性
通过使用集中式数据库服务器的强大功能,提供了可伸缩性和安全性。使用汇总表自动维护这一特性,能够进一步减少管理时间。 10. User Edition --随意查询、报告、深入和Web公布
Oracle Discoverer帮助最终用户在不需要了解SQL或者数据库结构的情况下,建立查询、报告,以及执行功能强大的搜索。最终用户层就是提供这一功能的转换机制。 建立强大的查询
使用User Edition建立查询是一个简洁、直观的工作。只需拖拽式操作,就能直接访问所需数据,以及改变工作面的布局。通过使用直观的循序渐进的 Wizard界面,能够建立条件过滤器和计算项目。不必担心数据类型、括号、函数名或者数据值。 全面报告
Copyright @ 2001 Oracle Corporation All rights reserved.
第 55 页
Oracle 公司数据仓库系统产品介绍
使用标准的报告模板(表格、交叉表格、组排序(或者中断)和控制表细节),能够满足你的商业需求。使用丰富多彩的字体、大小、前景和背景颜色,能够使数据显得栩栩如生。 异常报告
对大型数据集设置异常条件,能够轻松地确认兴趣范围,并且通过改变数据颜色产生醒目的效果。通过与Oracle Report的紧密集成,能够无缝地向企业级报告过渡。 灵活地搜索
广泛的深入函数提供了项目之间的深入,序列之间的向上和向下深入,以及从宏观到细节这一独特的深入能力。 适时深入
使用Oracle Discoverer独特的适时深入概念,能够在你需要的时候仅仅检索你需要的信息。条件深入允许少量、特定信息的检索--改善性能,减少网络负荷。使用经过最为广泛测试的界面,能够使你清楚地看到深入结果的多个层次。你能够在一致的界面中,根据年、季度、国家、地区和其它许多参数观察数据。
通过以图形方式进行显示,能够观察蕴藏在数据中的趋势和异常。图表格式包括以二维短维方式显示的区域型、线型、水平条、饼图、surface、pareto、doughnut、scatter、列、立方体、曲线、polar和open-hi-low-close。 11. Administration Edition--轻松的设置和维护
使用商业管理Wizard界面中快速、单按钮安装的能力,能够自动将数据充实到最终用户层。将信息组织到逻辑商业区域,能够使数据访问更加简便和直观。 12. 自动汇总管理
能够搜集统计数据,用于确认用户执行的累加计算。使用这个汇总Wizard的独特性质,能够建立和自动维护汇总表,从而极大地改善性能。使用汇总Wizard记录现有汇总表,以确保用户版在运行查询、使用上面描述的强大的自动汇总重定向能力时,能够利用这些汇总表。 13. Oracle集成
Copyright @ 2001 Oracle Corporation All rights reserved.
第 56 页
Oracle 公司数据仓库系统产品介绍
利用你在其它Oracle产品上的投资。Oracle Discoverer能够自动将语义数据从Oracle designer加载到最终用户层。使用Oracle Discoverer生成符合Oracle Reports格式的报告,就能够具有企业级报告能力。与Oracle核心的集成能够对基于Oracle的安全性、查询预测、求和表自动生成和维护等提供支持。最终用户层正在进行扩展,以支持Express序列产品和数据仓库应用。使用定制的商业区域和由NoetixTM提供的视图,能够以最小设置和维护迅速访问Oracle应用数据。建立你自己的商业区域,使最终用户能够访问任何由你开发的基于Oracle的应用。 14. 开放式访问
使用Open Meta Layer API,能够使其它工具访问存储在最终用户层的商业定义,这些API提供了精简的设置和维护功能。Oracle Discoverer符合OLE2标准,能够进行Microsoft Word和Microsoft Excel这样相似的桌面工具之间的数据传输。将数据输出和输入到通用文件格式中,从而使得在通用桌面工具之间能够进行信息交换。能够访问符合ANSI标准SQL92的非Oracle数据源,从而提供对于应用环境中所有数据源的无缝访问。
Web应用开发工具--Oracle Portal
Oracle Portal是一个用于建立、部署和灵活监视Web数据库应用和内容驱动的Web站点的解决方案。通过组合直观的HTML界面和健壮的、基于浏览器方式的完善HTML工具集,Oracle Portal允许用户轻松、快捷地开发Web数据库应用。Oracle Portal是一种最快、最容易的访问具有Web功能的Oracle数据库的方式。
Oracle Portal是一个工具集,其中包括建立动态Web应用和内容驱动的Web站点的所有必备工具。使用Oracle Portal开发的应用和Web站点完全包含在数据库之中。这里,不再需要在每一台机器上安装软件,不再需要使用FTP来远程管理文件,不再需要在每一次开发人员补救错误,并需要更新所部署的系统时,制定复杂的部署方案。Oracle Portal真正满足了INTERNET的挑战,真正实现了快速的应用开发和简化的应用部署。 Oracle Portal通过一个一流的高效的体系结构提供非常简单的生产能力,该体系结构的特征是客户端100%的在浏览器中,并且逻辑100%的在数据库中存储、管理。Oracle Portal使事务专家不需要编写任何一行代码就能够从Web连接和管理它们的数据。不需要编写任何代码!使用一种可视的基于浏览器的开发环境,即使初级的Web开发人员也可以在Oracle数据库中快速地创建和浏览数据库元素,然后将它们连接到智能的Web接口中.至于部署,它更是迅速的,只需命名URL.
Copyright @ 2001 Oracle Corporation All rights reserved.
第 57 页
Oracle 公司数据仓库系统产品介绍
通过浏览器提供一致的访问方法。从您熟悉的浏览器中建立、部署和管理Web站点和应用程序----这意味着开发地点的自由。系统管理工作可以在任何地点、任何时间完成,所以生产率大大提高。
通过非常智能的Oracle Portal接口直接在数据库中工作,您可以获得Oracle数据库的所有强大功能,并缩短与复杂的Web开发有关的学习过程。您可以浏览您在数据库中拥有的所有对象,查询和更新数据,创建复杂的drill-down图表,甚至执行存储过程。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 58 页
Oracle 公司数据仓库系统产品介绍
Oracle 的位图索引
ChinaITLab收集整理 2005-10-12 保存本文 推荐给好友 QQ上看本站 收藏本站 Oracle的索引主要包含两类:BTree和位图索引。默认情况下大多使用Btree索引,该索引就是通常所见 唯一索引、聚簇索引等等,Btree用在OLTP,加快查询速度。位图索引是Oracle的比较引人注目的地方,其主要用在OLAP(联机数据分析)方面,也就是数据仓库方面用到,目的是在加快查询速度是,节省存储空间。通常情况下,索引都要耗费比较大的存储空间,位图采用了压缩技术实现磁盘空间缩减。Btree用在高基数(即列的数据相异度大),位图用在低基数列。位图索引的基本原理是在索引中使用位图而不是列值。通常在事实表和维表的键之间有很低的集的势(cardinality),使用位图索引,存储更为有效,与B*Tree索引比较起来,只需要更少的存储空间,这样每次读取可以读到更多的记录,而且与B*Tree索引相比,位图索引将比较,连接和聚集都变成了位算术运算,大大减少了运行时间,从而得到性能上的极大的提升。
在Oracle中如何合理的使用位图索引?以下的几个事项应该考虑。
*如果要使用位图索引,初始化参数STAR_TRANSFORMATION_ENABLED应该设置为TRUE.
* 优化模式应该是CBO。对于数据仓库的环境中,总是应该考虑使用CBO(COST-BASEDOPTIMIZER)。
* 位图索引应该建立在每一个事实表的外键列上。(这只是一个一般的规则.)
此外,对于数据表中的cardinality如何客观的确定也是一个问题,一万条数据中只包含3个值的集和算是低的了,那么一亿条记录中包含3万条记录算不算低的呢?对于这样的情况,建议几行一下数据的模拟测试,一般来说,在数据仓库环境中,位图索引的性能要好
Copyright @ 2001 Oracle Corporation All rights reserved.
第 59 页
Oracle 公司数据仓库系统产品介绍
于B*Tree索引。还要注意位图索引不是为OLTP数据库设计的,不应该在OLTP数据库中大量的使用它,尤其是对那些有更新操作的表 。
Oracle的索引主要包含两类:BTree和位图索引。默认情况下大多使用Btree索引,该索引就是通常所见 唯一索引、聚簇索引等等,Btree用在OLTP,加快查询速度。位图索引是Oracle的比较引人注目的地方,其主要用在OLAP(联机数据分析)方面,也就是数据仓库方面用到,目的是在加快查询速度是,节省存储空间。通常情况下,索引都要耗费比较大的存储空间,位图采用了压缩技术实现磁盘空间缩减。Btree用在高基数(即列的数据相异度大),位图用在低基数列。位图索引的基本原理是在索引中使用位图而不是列值。通常在事实表和维表的键之间有很低的集的势(cardinality),使用位图索引,存储更为有效,与B*Tree索引比较起来,只需要更少的存储空间,这样每次读取可以读到更多的记录,而且与B*Tree索引相比,位图索引将比较,连接和聚集都变成了位算术运算,大大减少了运行时间,从而得到性能上的极大的提升。
在Oracle中如何合理的使用位图索引?以下的几个事项应该考虑。
*如果要使用位图索引,初始化参数STAR_TRANSFORMATION_ENABLED应该设置为TRUE.
* 优化模式应该是CBO。对于数据仓库的环境中,总是应该考虑使用CBO(COST-BASEDOPTIMIZER)。
* 位图索引应该建立在每一个事实表的外键列上。(这只是一个一般的规则.)
此外,对于数据表中的cardinality如何客观的确定也是一个问题,一万条数据中只包含3个值的集和算是低的了,那么一亿条记录中包含3万条记录算不算低的呢?对于这样的情况,建议几行一下数据的模拟测试,一般来说,在数据仓库环境中,位图索引的性能要好
Copyright @ 2001 Oracle Corporation All rights reserved.
第 60 页
Oracle 公司数据仓库系统产品介绍
于B*Tree索引。还要注意位图索引不是为OLTP数据库设计的,不应该在OLTP数据库中大量的使用它,尤其是对那些有更新操作的表 。
Oracle的索引主要包含两类:BTree和位图索引。默认情况下大多使用Btree索引,该索引就是通常所见 唯一索引、聚簇索引等等,Btree用在OLTP,加快查询速度。位图索引是Oracle的比较引人注目的地方,其主要用在OLAP(联机数据分析)方面,也就是数据仓库方面用到,目的是在加快查询速度是,节省存储空间。通常情况下,索引都要耗费比较大的存储空间,位图采用了压缩技术实现磁盘空间缩减。Btree用在高基数(即列的数据相异度大),位图用在低基数列。位图索引的基本原理是在索引中使用位图而不是列值。通常在事实表和维表的键之间有很低的集的势(cardinality),使用位图索引,存储更为有效,与B*Tree索引比较起来,只需要更少的存储空间,这样每次读取可以读到更多的记录,而且与B*Tree索引相比,位图索引将比较,连接和聚集都变成了位算术运算,大大减少了运行时间,从而得到性能上的极大的提升。
在Oracle中如何合理的使用位图索引?以下的几个事项应该考虑。
*如果要使用位图索引,初始化参数STAR_TRANSFORMATION_ENABLED应该设置为TRUE.
* 优化模式应该是CBO。对于数据仓库的环境中,总是应该考虑使用CBO(COST-BASEDOPTIMIZER)。
* 位图索引应该建立在每一个事实表的外键列上。(这只是一个一般的规则.)
此外,对于数据表中的cardinality如何客观的确定也是一个问题,一万条数据中只包含3个值的集和算是低的了,那么一亿条记录中包含3万条记录算不算低的呢?对于这样的情况,建议几行一下数据的模拟测试,一般来说,在数据仓库环境中,位图索引的性能要好于B*Tree索引。还要注意位图索引不是为OLTP数据库设计的,不应该在OLTP数据库中大量的使用它,尤其是对那些有更新操作的表 。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 61 页
Oracle 公司数据仓库系统产品介绍
Oracle的索引主要包含两类:BTree和位图索引。默认情况下大多使用Btree索引,该索引就是通常所见 唯一索引、聚簇索引等等,Btree用在OLTP,加快查询速度。位图索引是Oracle的比较引人注目的地方,其主要用在OLAP(联机数据分析)方面,也就是数据仓库方面用到,目的是在加快查询速度是,节省存储空间。通常情况下,索引都要耗费比较大的存储空间,位图采用了压缩技术实现磁盘空间缩减。Btree用在高基数(即列的数据相异度大),位图用在低基数列。位图索引的基本原理是在索引中使用位图而不是列值。通常在事实表和维表的键之间有很低的集的势(cardinality),使用位图索引,存储更为有效,与B*Tree索引比较起来,只需要更少的存储空间,这样每次读取可以读到更多的记录,而且与B*Tree索引相比,位图索引将比较,连接和聚集都变成了位算术运算,大大减少了运行时间,从而得到性能上的极大的提升。
在Oracle中如何合理的使用位图索引?以下的几个事项应该考虑。1、如果要使用位图索引,初始化参数STAR_TRANSFORMATION_ENABLED应该设置为TRUE; 2 优化模式应该是CBO。对于数据仓库的环境中,总是应该考虑使用CBO(COST-BASEDOPTIMIZER)。
3、 位图索引应该建立在每一个事实表的外键列上。(这只是一个一般的规则.) 此外,对于数据表中的cardinality如何客观的确定也是一个问题,一万条数据中只包含3个值的集和算是低的了,那么一亿条记录中包含3万条记录算不算低的呢?对于这样的情况,建议几行一下数据的模拟测试,一般来说,在数据仓库环境中,位图索引的性能要好于B*Tree索引。还要注意位图索引不是为OLTP数据库设计的,不应该在OLTP数据库中大量的使用它,尤其是对那些有更新操作的表 。
Copyright @ 2001 Oracle Corporation All rights reserved.
第 62 页
因篇幅问题不能全部显示,请点此查看更多更全内容