您当前所在位置:首页 > 论文 > 理学论文 > 统计学论文

R软件在系统聚类分析中的应用

编辑:

2013-12-12


  二、基于R语言的系统聚类分析程序
  R软件及其相关包提供了各种聚类方法,主要是系统聚类方法、快速聚类方法、模糊聚类方法,常用的是系统聚类方法。
  R软件实现系统聚类的程序如下:
  hclust(d,method="complete",members=NULL)
  其中,d是由“dist”构成的距离结构,具体包括绝对值距离、欧氏距离、切比雪夫距离、马氏距离、兰氏距离等,默认为欧氏距离;method包括类平均法average、重心法centroid、中间距离法median、最长距离法complete、最短距离法single、离差平方和法ward等,默认是最长距离法complete。
  三、应用举例
  表1是山东省2008年各市居民家庭平均每人全年消费性支出,利用所给数据对各市进行系统聚类。(表1)
  R语言程序如下:
  >X<-read.delim("clipboard",header=T)
  >row.names(X)<-c("济南","青岛","淄博","枣庄","东营","烟台","潍坊","济宁","泰安","威海","日照","莱芜","临沂","德州","聊城","滨州","菏泽")
  >d<-dist(scale(X))

>hc1<-hclust(d,"single")#最短距离法
  >hc2<-hclust(d,"complete")#最长距离法
  >hc3<-hclust(d,"median")#中间距离法
  >hc4<-hclust(d,"ward")#Ward法
  >opar<-par(mfrow=c(2,2))
  >plot(hc1,hang=-1);plot(hc2,hang=-1)
  >plot(hc3,hang=-1);plot(hc4,hang=-1)
  输出结果(图1)
  结果分析
  由图1可以看出,不同方法的分类大体一样,结合山东省具体实际情况,最长距离法分类效果较好。
  在系统聚类分析中,利用R软件是最方便、最简单、最易学的,而且根据不同的情况,可以自己修改别人的程序,比较方便;可以在处理多元数据聚类分析中,利用R软件具有很大的优势。

R软件在系统聚类分析中的应用就为朋友们整理到此,希望可以帮到朋友们! 

相关推荐:证券期货市场中统计学与之相关学科的应用

大规模的统计学普及教育势在必行

标签:统计学论文

免责声明

精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处,版权归原作者及原网站所有,如果您对本站信息资源版权的归属问题存有异议,请您致信qinquan#51edu.com(将#换成@),我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。