数据挖掘技术中的抽取存储管理和展现

数据挖掘技术中的抽取存储管理和展现,第1张

数据挖掘技术中的抽取存储管理和展现,第2张

从技术上讲,根据其工作过程,可以分为数据抽取、数据存储和管理、数据显示等关键技术。

数据析取

数据抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将来自联机事务处理、外部数据源和脱机数据存储介质的数据导入到数据仓库中。技术上,数据抽取主要涉及互联、复制、增量、转换、调度和监控。在数据抽取方面,未来的技术发展将侧重于系统功能的集成,以适应数据仓库本身或数据源的变化,使系统更易于管理和维护。

数据存储和管理基于

数据仓库的组织和管理决定了它不同于传统数据库的特点,也决定了它对外数据的表现形式。数据管理涉及的数据量比传统的事务处理要大得多,而且随着时间的推移,数据量会迅速积累。数据仓库的数据存储和管理需要解决的是如何管理大量数据,如何并行处理大量数据,如何优化查询等。目前很多数据库厂商提供的技术解决方案是扩展关系数据库的功能,将通用数据库改造成适合数据仓库的服务器。

数据显示

在数据呈现方面,主要的方式有:

查询:实现预定义查询、动态查询、OLAP查询和智能查询,用于决策支持;报表:生成关系数据表、复杂表、OLAP表、报表以及各种综合报表;可视化:利用通俗易懂的点线图、直方图、饼状图、网络图、交互式可视化、动态模拟、计算机动画技术表达复杂的数据及其关系;统计:进行均值、值、最小值、期望、方差、汇总、排名等各种统计分析;挖掘:利用数据挖掘等方法,从数据中获取关于数据关系和模式的知识。

位律师回复
DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 数据挖掘技术中的抽取存储管理和展现

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情