您当前的位置:首页 >  党建材料 >  入党自传 > 内容

利用聚类分析研究全国教育的发展状况

无忧文档网    时间: 2019-11-13 06:09:44     阅读:


  摘要:文章对全国各省份进行大概的聚类分析,来分析当前全国教育发展情况。首先建立好分类指标体系,找好数据,之后通过SPSS的聚类分析功能来得出结论。
  关键词:教育指标;聚类分析;SPSS
  
  一、引言
  
  教育是发展科学技术和培养人才的基础,在现代化建设中具有先导性全局性作用。全国各地教育的发展存在着不少差异。下面,根据全国各省的教育状况进行区域的划分,以便进行分类的指导。利用世界著名的统计软件SPSS进行聚类分析功能,对各省份进行聚类分析,以便很好地归类。
  
  二、聚类分析简介
  
  (一)聚类分析概述
  聚类分析是根据研究对象的个体特征,对其进行分类的方法。分类在经济、管理、社会学、医学等领域有着广泛的应用。例如,有p个指标,n个对象在p个指标下的数据,对这n个对象进行聚类。
  (二)聚类分析作法
  1、将数据标准化
  为了消除不同变量单位对聚类结果的影响,应当首先对所有的数据标准化:xij=
  2、计算对象之间的距离
  计算对象之间的“距离”,得到对象之间的“相似关系”矩阵R(rij)。“距离”有多种表达:
  (1)欧氏距离(的平方):r2ij=(xik-xjk)2
  (2)偏差距离:rij=xik-xjk
  (3)相关系数:
  rij=
  (4)明考夫斯基距离(的q次方):rijq= xik-xjkq
  (5)马氏距离(的平方):r2ij=(xi-xj)TV-1(xi-xj)
  3、选择类与类之间的距离定义
  类与类之间的距离可用“代表点”之间的距离表示。下面列举其中两种方法:
  (1)用两个类之间的距离最近(或最远)的点,分别作为这两类的代表点。
  (2)用两个类(类S和类T)中所有点的距离(平方的)平均值,作为两个类之间的距离(的平方):d2(S,T)=d2ij,这种方法也叫组间连接法(本文采用的方法)
  4、聚类
  (1)把每个点(对象)作为一类。
  (2)找出距离最小(或者最大的)dij,从而得到距离最近(或最远)的两类i和j,把它们合并为更高的一类。这样不断重复,知道所有点都并入一个大类。
  5、分类
  分类的数目符合使用的目的。
  
  三、建立指标体系
  
  全国各地教育发展水平差异较大例如各省份的教育水平、教育观念、师资力量、教育手段和设备都不相同。经济发达地区教育发展水平较高。这里讨论的教育发展水平主要是从教育的“硬件设备”来讨论。联合国教科文组织(UNESCO)出版的《世界教育报告》对各国教育状况的数据和资源进行适当分析、筛选、整理和再加工,汇集出与特定指标相关的信息。它提出了几个方面评价教育发展水平:教育供给(资源)、入学与参与、人力资源、教育内部效率、教育产出等。
  本文根据这几项概括中选出一些指标用来对全国各省份进行聚类。教育经费是教育供给的主要方面。对人力资源可用师生比代表,入学与参与采用升学率,教育内部效率可用升学率代表,教育产出利用文盲人口占15岁以上比重表示,入学与参与采用每10万人口平均在校生表示(本文采用的数据来自中国统计年鉴2007年)。
  
  其中升学率的公式采用教育统计常用公式:升学率= ×100%
  本文中升学率采用了普通小学升学率、普通初中升学率、普通高中升学率。每十万人口平均在校生和师生比选取了小学、初中、高中、高等学校4个类型。
  根据中国统计年鉴2007年,教育经费投入到普通小学、普通初中、普通高中、普通高等学校的比例大概是3∶2∶1∶2,因此可以近似把它当作权重,再利用公式:
  人均在学生指数
  =
  权重的选择很好解决指标间数量级的等方面的矛盾。
  人均在校学生数也是一个百分比值。用这个指标代替每10万人口平均在校生数来进行聚类。
  教育经费与地区生产总值之比是因为国内有学者曾对教育经费支出与GNP的Pearson相关系数很高。教育经费与GNP存在着内在的密切联系。并且认为教育投资与GNP存在着因果关系。
  师生比是某待定教育层次在指定年份中的学生人数与同年同一教育层次工作的教师人数之比。它反映某特定教育层次在某年每位教师平均负责教育学生的人数。
  
  四、聚类分析
  
  利用SPSS根据指标对全国各省份进行聚类。
  
  对31个省和直辖市进行聚类。选择了组间聚类的方法。
  表3给出了聚类的过程,表格中部的coefficient列给出了合并时类间的距离。而且可以看到类间距离越来越大。在该列左边给出了第几步谁和谁并成一类。在该列后边,给出了个体首次被聚类的步骤号。
  图1清楚地表示了聚类的全过程,它将实际的距离按比例调整到0-25的范围内,用逐级连线的方式连接性质相近的个案或新类,直到并为一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离,然后垂直标尺划线,该垂直线与水平连线相交,则相交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。
  
  五、分析与结论
  
  对全国所有省份和城市进行的教育发展水平进行划分,并不是划分约多越好,也不能太少。基本上,可以对其分为4类。首先看到西藏(2)和北京(28)地区。西藏地区经济不发达,人民生活比较贫困,教育事业还处在起步阶段,教育设施还不完善。政府应该多投入教育经费到西藏支持其建设。至于北京,首都北京是全国文化中心,这是它的城市职能,很重要的表现之一就是名校云集。北京的学生能相对较容易地考入清华北大,升学率高。政府对其教育经费投入也比较大。因而北京可以说是全国教育水平最强的城市。青海、宁夏、甘肃、贵州、云南、安徽归为一类前四个省份的都算是欠发达地区.欠发达地区经济落后,穷省办大教育,面临极大的困难和挑战;欠发达地区经济发展状况与高等教育规模不对称,存在诸多矛盾现象.重新审视高等教育财政投资理论,针对欠发达地区高等教育财政投资的困境,需建立贫困地区高等教育成本中央财政投资补偿制度和地区间投资补偿制度.至于安徽,经济发展中等,但其文盲率居然占很大比重。安徽要调整好农村产业结构,提高农村人口素质。剩下的省份归为一类,各省的教育发展指标没有太大差异。广东、上海、江苏等地虽然经济发达,但教育投入比例和其他省份相差不大,所有归一类。当然,还可以对这一类进行细分来分析。
  所以一个地区的教育水平跟该地区的经济还是有很大关系的。教育的投入比例也是与教育水平有关系的。
  
  参考文献:
  1、马庆国.管理统计——数据获取、统计原理 SPSS工具与应用研究[M].科学出版社,2002.
  2、中国统计局.中国统计年鉴2007[M].中国统计出版社,2007.
  3、王绽蕊.区域教育发达程度衡量指标体系的构建[J].教育发展研究,2000(12).
  4、叶平.教育发展水平综合指标及其因果关系探析[J].教育研究,1992(7).
  *本文为广东省自然科学基金资助项目(项目编号:04009492,06201498)。
  (作者单位:广东工业大学)
  
  注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

《利用聚类分析研究全国教育的发展状况.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

相关热搜

《利用聚类分析研究全国教育的发展状况.doc》

VIP请直接点击按钮下载本文的Word文档下载到电脑,请使用最新版的WORD和WPS软件打开,如发现文档不全可以联系客服申请处理。

文档下载
VIP免费下载文档

浏览记录