《数据挖掘:概念与技术》

正文

《数据挖掘:概念与技术》

2018-06-14 | 作者 : jiping

category : 文献共享

文献下载

《数据挖掘:概念与技术》

摘要

  • 数据库技术已经从原始的数据处理,发展到开发具有查询和事务处理能力的数据库管理系统。进一步的发展导致越来越需要有效的数据分析和数据理解工具。这种需求是各种应用收集的数据爆炸性增长的必然结果;这些应用包括商务和管理、行政管理、科学和工程、环境控制。
  • 数据挖掘是从大量数据中发现有趣模式,这些数据可以存放在数据库、数据仓库或其它信息存储中。这是一个年青的跨学科领域,源于诸如数据库系统、数据仓库、统计、机器学习、数据可视频化、信息提取和高性能计算。其它有贡献的领域包括神经网络、模式识别、空间数据分析、图象数据库、信号处理和一些应用领域,包括商务、经济和生物信息学。
  • 知识发现过程包括数据清理、数据集成、数据变换、数据挖掘、模式评估和知识表示。
  • 数据模式可以从不同类型的数据库挖掘;如关系数据库,数据仓库,事务的、对象-关系的和面向对象的数据库。有趣的数据模式也可以从其它类型的信息存储中提取,包括空间的、时间相关的、文本的、多媒体的和遗产数据库,以及万维网。
  • 数据仓库是一种数据的长期存储,这些数据来自多数据源,是有组织的,以便支持管理决策。这些数据在一种一致的模式下存放,并且通常是汇总的。数据仓库提供一些数据分析能力,称作 OLAP(联机分析处理)。
  • 数据挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。特征和区分是数据汇总的形式。
  • 模式提供知识,如果它易于被人理解、在某种程度上对于测试数据是有效的、潜在有用的、新颖的,或者它验证了用户关注的某种预感。模式兴趣度度量,无论是客观的还是主观的,都可以用来指导发现过程。
  • 数据挖掘系统可以根据所挖掘的数据库类型、所挖掘的知识类型、或所使用的技术加以分类。
  • 大型数据库中有效的数据挖掘对于研究者和开发者提出了大量需求和巨大的挑战。问题涉及数据挖掘技术、用户交互、性能和可规模性、以及大量不同数据类型的处理。其它问题包括数据挖掘的应用开发和它们的社会影响。
label :
    请 登陆 后进行评论

评论列表 ( 0 )

 



最多关注
近期文章