论文导读::近年来人民生活水平随着经济发展得到了很大的提高,而消费结构是衡量人民生活水平的重要方面。本文基于SPSS 应用软件,利用因子分析方法、聚类分析方法,对全国31个省市的城市居民消费结构进行全面统计分析比较。通过分析和评价影响消费结构的各项指标,总结了各城市居民消费结构的一些特点和规律,以及产生各地区消费差异的原因,并给出理论建议。
论文关键词:SPSS,应用软件因子分析方法,聚类分析方法居民消费水平,地区消费结构
随着我国经济的快速发展,城镇居民的收入不断增加,我国各地区城镇居民的消费支出强劲增长,消费结构发生了巨大的变化。但是,由于各地区的经济发展不平衡及原有经济基础的差异,各地区的消费结构仍存在着明显差别。为了进一步改善消费结构,正确引导消费,提高我国城市居民的消费水平和生活质量,有必要对各地区城镇居民的消费结构之间的异同进行考察与比较,以期发现特点和规律,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平提供决策依据。
一、对地区消费水平的差异的分析方法
1 因子分析模型的建立
因子分析模型是根据变量间的相关性大小,把变量分组毕业论文怎么写,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以由下面的数学模型来表示[[1]]:
其中:,,,…,为p个原有变量,是均值为0、标准差为1 的标准化变量;,,,…,为m个因子变量,m 小于p,表示成矩阵形式为
,
其中:F因子变量或公共因子,可以将它们理解为在高维空间中互相垂直的m个坐标轴;为特殊因子;F 与均为不可观测的随机变量。 A为因子载荷矩阵,称为因子载荷,是第i个原有变量对第j个因子上的载荷系数。在模型中,特殊因子表示了原有变量不能被因子变量所解释的部分,相当于多元回归分析中的残差,被定义为彼此不相关且与公因子也不相关。
2 实证分析
居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。它主要通过消费的物质产品和劳务的数量和质量来反映。
在各种消费指标中,消费结构指标最能够体现出各地区间的消费水平差异,本文引用我国常用的消费资料支出分类方法,将各地区城市居民人均生活费支出分为8个部分,相应的指标分别用X1~X8表示 。其中X1(食品)、X2(衣着)、X3(居住)、X4(家庭设备用品和服务)、X5(医疗保健)、X6(交通和通讯)、X7(娱乐教育文化服务)、X8(其他商品与服务),单位:元
2.1 因子分析
2. 1.1 数据来源
本文数据取自各地区域城镇居民家庭平均每人全年消费性支出(2009年),来自2010年中国统计年鉴[[2]]。具体表格略论文开题报告范文。
2.1.2因子分析的过程
由于多个变量使用的量纲可能各不相同或者变量间的数值大小相差很大,因此, 首先将初始变量标准化,把原变量数列化为均值为0,方差为1的数列。标准化后全国31个省市作为样本,将上述X1~X8八项支出指标作为变量,得到原始数据阵。首先判断数据变量是否适合进行因子分析,算出样本相关系数阵为:
表1:样本相关系数阵
由上述矩阵发现8个消费要素间的相关系数大部分均大于0.3,适合做因子分析。
再进行KMO统计检验,作为比较变量间简单相关系数和偏相关系数的指标,数学定义为,其中是变量与其他变量的简单相关系数,是变量与变量在控制了剩余变量下的偏相关系数。
Kaiser给出了常用的KMO度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。
计算结果如下:
表2
并且通过巴特利特球体检验(P=0.000<0.05),表明说明原有的8个变量具有很强的相关性,它们反映的消费要素有很大重叠毕业论文怎么写,可以做因子分析。
利用SPSS计算后得到主成分的碎石图,分析发现提取2个主因子比较合适。
利用主因子分析法提取2个主因子,用最大方差旋转进行简化,得到因子载荷矩阵(见下表),它代表变量和公因子的相关系数:
表3
由表1 载荷矩阵可得出以下结论:
(1)第1 主成分,为主要消费因子,在食品、居住、交通和通讯、家庭设备用品、服务娱乐教育文化服务和其他商品与服务6个方面有较大的载荷,即该因子综合反映了这6个方面的变动趋势。 因此第1 主因子可以视为代表各地区城市居民在这6个方面的消费指标,可命名为生活必需型因素。
(2)第2 主成分,为次要消费因子,在衣着、医疗保健有较大的载荷,所以第2 主因子可视为各地区城市居民在这2方面的消费指标,可命名为生存型因素。如受此影响的地区多为北方省市,可分析为气候因素的影响。
从二维的旋转空间的成分图可以明显的看到各个消费要素间的类属关系,可以看到主消费因子和次消费因子非常靠近两个因子的坐标轴,表明用两个因子刻画消费要素效果非常好,信息丢失较少,达到了我们综合消费要素,减少解释变量的目的,使得提前的因子含义清晰,有利于我们对消费要素进行归类进行分析解释:
表4
2个因子能解释的方差分别为5.640(70.494 %),1.155(14.440 %),因此这2个主因子能说明总情况的84.935%。8个变量标准化后(不受各变量的不同量纲的影响),最后各变量X1~X8相对应的共性值之和分别为0.916,0.854,0.744,0.783,0.843,0.892,0.926,0.835,除居住外均大于0.75,所以这些变量对各地区城市居民消费结构的分析具有很强的说服力。
根据标准化数据,分别计算各地区城市主要、次要消费因子得分,以各因子方差贡献率作权重进行加权汇总,得出各地区居民消费水平综合评价得分并排名,表中因子得分情况及其正负仅表示该省市与平均水平的相对位置,并不说明该省市的居民消费发展水平为负。
综合评价排名V=0.704 * F1+0.144 * F2
2.1.2.1我国区域居民消费水平排序及解释(由于篇幅限制,在这里只列取前10位)
表5:全国各省市居民消费因子得分及排名表
地区
F得分
F1排名
F2得分
F2排名
综合得分
综合排名
上海
3.34231
1
0.44751
7
2.42
1
广东
2.23941
2
-0.75061
9
1.47
2
北京
1.32859
4
2.06475
1
1.23
3
浙江
1.35439
3
0.58846
6
1.04
4
福建
1.13345
5
-0.98121
10
0.66
5
天津
0.69190
6
1.05934
2
0.64
6
江苏
0.59168
7
-0.05948
8
0.41
7
辽宁
-0.02806
8
0.61654
5
0.07
8
山东
-0.17779
9
0.84007
4
0.00
9
重庆
-0.19444
10
0.88520
3
-0.01
10
2)第二主因子是衣着消费与医疗保健,这一指标在全国城镇居民的消费中差异不大,衣着消费是居民的基本生活消费,受地区、气候、文化背景、生活方式等因素的影响较大,而受经济发展水平和收入影响相对较小,排在前五位的为北京、内蒙古、吉林、天津、黑龙江,均为北方城市。由数据分析,北方地区对衣着的消费需求水平要高于南方地区。这与北方气候寒冷,衣着消费更高的实际相符。对于医疗保健,由于我国城镇居民享有一定的医疗福利待遇,如公费医疗及医疗保险,所以这项支出受收入水平影响较小,另外医疗保健支出除了受地区因素影响外,还受收入水平影响,收入水平高的地区更重视保健的需求,如广东省,医疗保健的支出水平较高主要是保健的比例高。
2.2 聚类分析(cluster analysis)
系统聚类分析的基本思想是认为所研究的样品(或指标)之间存在不同程度的相似性。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些相似程度较大的样品(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样品都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分
类系统[[3]]。
聚类分析的原理是,设有n个样品,每个样品均可以得到p个观测指标,用表示第i个样品的第j个观测指标,那么以为元素的矩阵
被称为观测数据矩阵。以常见的Q型聚类分析为例,由此矩阵计算出相似统计量,并依据相似统计量对n个样品进行分类,目的是找出样品的共性,从而将样品进行分类[[4]]论文开题报告范文。
以2009年的城镇居民家庭平均每人全年消费性支出进行分析:
1. 分析结果输出
基于主成分分析的系统聚类((HierarchicalClustering Method)结果为:
表6:聚类谱系图(Hierarachical diagram)
层次聚类分析按综合消费水平把全国31个地区分为3类:第一类包括高消费地区的北京、上海等地;第二类包括中等消费地区的天津、江苏等地;其余的为第三类。详见下表7:
表7:2009年我国城镇居民消费结构分类
类别
地区
第一类 高消费水平
北京、上海、广东、浙江
第二类 中等消费水平
天津、江苏、福建、重庆、辽宁、山东、内蒙古
第三类 低消费水平
安徽、江西、湖北、湖南、四川、贵州、陕西、甘肃、青海、河北、山西、吉林、黑龙江、河南、宁夏、新疆、广西、海南、云南、西藏
中国论文网(www.lunwen.net.cn)免费学术期刊论文发表,目录,论文查重入口,本科毕业论文怎么写,职称论文范文,论文摘要,论文文献资料,毕业论文格式,论文检测降重服务。