隐藏按钮
慧科企业邦服务联系电话
慧科企业邦服务市场部二维码

数据挖掘主要分为哪几种形式

2022年5月17日 16:29

预测可分为定性预测和定量预测两类,其中定量预测又分为时序关系预测法和因果关系预测法。时序关系预测法是发掘客观事物在时间轴上发展的惯性趋势,用变量把纵向统计资料进行外推的预测方法。因果关系预测法则是根据观测对象的依存关系,以事物变化的因果关系为基础,用近似的函数形式表示出来,依靠历史数据构建相应的因果关系模型,适用于横向统计资料。数据挖掘主要分为哪几种形式?

 

数据挖掘主要分为哪几种形式


 
1、类知识挖掘


分类和聚类是数据挖掘中的重要目标和任务,分类的目是通过构造分类器,能够实现将数据库中的项映射到指定分类类别。经过模型训练和稳健性检验后,进一步能够对新的输入样本进行分类。因此,从机器学习的观点,分类是一种有监督的学习过程。常见的分类方法可以采用算法分类、树形结构分类或网络分类等。聚类是把训练样本数据集按照相似性聚合成若干个子集或叫“簇”,其目的是使属于同一个簇的数据集样本之间的差别尽可能小,而不同簇上的样本间的差别尽可能大。可见,聚类分析是一种无监督的学习过程,其结果的有效性不像分类那样通过测试样本的准确率去衡量,而是通过解读生成的一系列子集是否有意义,能否从中解读出有含义的聚类规则来判断。


2、预测型知识挖掘


预测型知识数据挖掘是由历史的和当前数据产生并能预测未来趋势的规律。以预测为目的的数据集通常包含时间属性,因此可以认作是以时间为关键变量的挖掘。预测型挖掘的输出对象可以数值型也可以扩展为概念分类型,使用的方法既包含统计学中经典的回归分析法,也包括人工神经网络以及机器学习领域的相关理论及方法。


交通事故预测是对道路交通事故未来的发生状况做出估计和推测,其定量预测方法根据预测范围分为宏观预测和微观预测两种。宏观预测是对国、区域或城市的事故整体水平进行预测分析。预测目的是分析研究社会经济发展、人口数量变化、汽车保有量、非机动车拥有量以及交通法规政策对交通安全的影响。