构建数据仓库是为企业决策者作出战略决策提供信息,这些用户用终端用户访问工具与数据仓库打交道,有五类访问工具:报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。数据仓库系统是一个信息提供平台,它从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识,实现对企业数据进行管理。
企业数据仓库的发展趋势
数据仓库已经被企业所采用已有十多年的时间,其中的成功或失败都为许多企业提供了宝贵经验。随着数据仓库使用者日益成熟,人们对数据仓库的期望也不断提高。随着许多企业以运用业界最佳实例与先进的技术,开始重整其数据仓库,因此也就逐渐迈入第二代的数据仓库。数据仓库已从后端的策略性决策支持系统,变为整个企业运营的一个关键组件。
第一代“数据仓库”通常是部门级的数据集市,仅能支持来自特定部门的有限查询,容易导致信息重复、各数据集市的信息不一致、无法解答企业层的问题,更不用提支持所有分散系统所需的高额成本。然而,那些已将数据集市整合至集中数据仓库的公司,则已开始体验到整合数据集市所带来的优势,以及以前不可能达到的业务成果。
实现客户关系管理(CRM)与数据仓库之间的整合,成功的CRM必须是基于对企业当前的、历史性的及数据统计详细资料的整合的分析,即必须是以数据仓库为基础。动态数据仓库包含了操作系统的整合分析,以制定最佳的战术和策略性决策。采用数据仓库的领导厂商正积极导入动态数据仓库,以提高工作效率,使其数据仓库的投资回报率达到最高,为其客户提供更佳的服务,并改善整体的业务。
企业的数据库与数据仓库之间关系
数据库是面向事务的设计,数据仓库是面向主题设计的;数据库一般存储在线交易数据,数据仓库存储的一般是历史数据;数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计;数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表;数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。近年来,随着数据库技术的应用和发展,人们尝试对数据库中的数据进行再加工,形成一个综合的,面向分析的环境,以更好支持决策分析,从而形成了数据仓库技术。数据仓库的关键是数据库,以辩证的眼光来看,数据仓库的兴起实际上是数据管理的一种回归,是螺旋式的上升。 数据仓库是一种概念,不是一种产品,它包括电子邮件文档、语音邮件文档、CD-ROM、多媒体信息以及还未考虑到的数据。数据仓库最根本的特点是物理地存放数据,而且这些数据并非是最新的、专有的,而是来源于其它的数据库。数据仓库的建立并不是要取代原有的数据库,而是建立在一个较全面、完善的信息应用的基础上,用于支持高层决策分析。数据仓库是数据库技术的一种新的应用,它是用数据库管理系统来管理其中的数据。
目前象IBM、Oracle、Sybase、CA、NCR、Microsoft和SAS等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案。IBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse、Essbase/DB2 OLAP Server、IBM DB2 UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS);Oracle数据仓库解决方案主要包括Oracle Express和Oracle Discoverer两个部分;Sybase提供的数据仓库解决方案称为Warehouse Studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。Microsoft SQL Server 是一个全面的、集成的、端到端的数据解决方案,可以支持TB级的数据仓库,它为企业中的用户提供了一个安全、可靠和高效的平台用于企业数据管理和商业智能应用。
企业数据管理为什么要选择数据仓库
调查研究表明,大多数企业并不缺少数据,而是受阻于过量的冗余数据和数据不一致;而且它们变得越来越难于访问、管理和用于决策支持;其数据量正以成倍的速度增长。那么怎样把大量的数据转换成可靠的、商用的信息以便于决策支持呢?数据仓库广泛地被公认为是最好的解决方案。
数据仓库化是企业范围内数据的处理过程,它将企业内分散的原始操作数据和来自外部的数据汇集和整理在一起,为企业提供完整、及时、准确和明了的决策信息,使最终用户能够真正利用决策支持系统(DSS)工具直接从企业信息池中随机地提取、分析数据,有效地服务于企业的全方位决策。作为一个决策支持环境,数据仓库收集存储了各种不同数据源中的数据。通过数据的组织给决策支持者提供分布在整个企业内部跨平台的数据。
接下来,现有的管理系统和现有的数据仓库将得到扩展,一是使数据仓库从一种局部的企业解决方案扩展到企业外部,扩展到企业的用户中去,使企业用户的数据仓库使用面更加广泛,这些可以通过Internet/Intranet的帮助来实现,这是数据仓库与电子商务相互融合的一点;二是使数据仓库从一种企业数据管理工具扩展到企业辅助决策工具,能够充分利用数据仓库中的数据资源,为企业的发展起到辅助决策的功能,使企业用户的数据仓库得到更加深入的使用,这些可以通过数据库厂商提供的工具来实现,也可以由其它软件公司提供的独立工具包来实现,这是数据仓库与商务智能相互融合的一点。
数据仓库的概念一经出现,就首先被用于金融、电信、保险等主要传统数据处理密集型行业。下面我们就以数据仓库在证券业和银行领域的应用为例来说明。数据仓库在证券行业的应用十分广泛,它可以处理客户分析、账户分析、证券交易数据分析和非资金交易分析等多个业界关心的主题。数据仓库、OLAP、数据挖掘、多媒体和高带宽网络技术为银行的科学管理提供了新的技术支持,利用数据仓库的强大功能,银行可以建立企业客户群和个人客户群的数据仓库,并对企业的结构、经营、财务以及市场竞争等多个数据源进行统一组织,形成一个一体化的存储结构,为决策分析奠定基础。通过先进的信息加工、分析和处理,加上银行的经营决策及信贷营销人员的经验,对每一个投资方向和每一笔贷款做出科学的判断,可以有效控制投资及信贷风险。