主成分分析与回归分析

2024-06-22

主成分分析与回归分析(通用11篇)

1.主成分分析与回归分析 篇一

基于主成分回归的GPS高程曲面拟合

本文阐述了多项式曲面拟合GPS高程中参数数目对法方程条件数和结果的影响,当过度参数化时,观测方程的法方程会病态,传统的`最小二乘无法得到可靠的结果,岭估计到目前为止仍然没有一种很好的确定岭参数的方法,主成分估计可以在保持原始数据信息损失最少的前提下,实现数据的降维避免法方程病态,从而得到参数的精确估值.并且把该方法运用于某测区,通过比较不同方法和不同参数数目时的计算结果,得出主成分估计在不同参数时都可以取得比较满意的结果,同时计算结果表明中心化和标准化对于多项式曲面拟合GPS高程的必要性.

作 者:冯光财 陈正阳 FENG Guang-cai CHEN Zheng-yan 作者单位:中南大学测绘与国土信息工程系,长沙,410083刊 名:测绘科学 ISTIC PKU英文刊名:SCIENCE OF SURVEYING AND MAPPING年,卷(期):32(1)分类号:P228关键词:主成分分析 岭估计 GPS高程 多项式曲面拟合

2.主成分分析与回归分析 篇二

出口、投资和消费一直被认为是拉动我国经济增长的“三驾马车”, 然而回顾我国改革开放三十多年的经济增长过程, 消费在我国经济增长过程发挥的作用仍有待加强。事实上, 与发达国家相比, 我国的消费不足主要表现在居民消费不足。自2000年以后, 中国的消费率 (最终消费支出占支出法GDP的比重) 呈逐年下降的趋势, 尤其是2007年以后, 消费率下降并一直保持在50%以下;在中国的最终消费结构中, 居民消费和政府消费呈现此消彼长的变化趋势, 居民消费占总消费的比重从1995年的77%下降到2010年的71%, 而在此期间, 政府消费则从23%上升至29%;自2000年以来, 中国居民的消费增长既落后于固定资产投资增长, 也落后于经济 (GDP) 增长。

2 文献回顾

学术界对中国居民消费需求不足的原因进行了大量的研究, 出现了不少富有启发性的和有价值的研究结论和研究方法。概括而言, 学者主要将我国居民消费不足的原因归纳为以下几点。

(1) 收入分配不均抑制消费增长。

自改革开放以来, 尤其是20世纪90年代至今, 随着市场经济在我国的日益深入, 东中西部、城乡之间、行业之间的收入分配差距日益扩大, 中低收入人群的低支付能力使得总消费需求不足 (毛盛勇, 2007;邹红, 喻开志, 2011) 。

(2) 消费结构升级换代导致消费推迟。

尚不成熟的供给结构无法满足居民日益提高的消费结构, 造成了消费推迟, 影响居民消费增长 (毛盛勇, 2007;张红伟, 吴瑾, 2011) 。

(3) 保守的居民消费习惯减弱居民消费增长。

多数观点认为, 由于长期的文化和经济发展原因, 我国居民消费习惯与西方发达国家相比更加保守和谨慎 (杭斌, 2010) , 消费倾向偏低, 具体表现为看重储蓄, 厉行节约, 不愿意负债消费。

(4) 社会保障制度落后降低居民消费倾向。

不少学者认为, 我国的低消费倾向与我国的社会保障制度相对弱后存在明显的关系。相对滞后的社会保障体系, 使得居民不得不面对失业、住房、医疗、教育等压力, 出于预防性或谨慎性动机的储蓄成为居民应对这些压力的首要选择 (万广华等, 2003) 。

此外, 还有不少学者从政府政策、金融发展等方面分析了中国居民消费需求不足的原因。

由上可知, 对我国消费的影响因素, 学者有不同的看法。本文根据已有的研究, 总结影响消费的若干因素, 在此基础上进行多重共线性诊断, 并用主成分分析法消除变量之间的多重共线性, 选择主成分, 对我国居民消费进行回归, 从而得出影响我国居民消费的主要因素, 并在此基础上提出提高我国居民消费的建议。

3 实证分析

3.1 模型设定与数据来源

本文模型的被解释变量是居民最终消费的人均支出Y, 解释变量有7个, 包括:人均收入 (用人均国内生产总值代替) X1, 分配状况X2 (通过计算城镇居民可支配收入与农村居民纯收入的比值得出) , 居民消费价格指数X3, 就业率X4, 年存款基准利率X5, 未成年人口负担率X6和老年人口负担率X7。采用我国1985-2010的年度数据, 数据来源于历年《中国统计年鉴》以及国研网统计数据库, 运用SPSS18.0软件进行分析和回归。

模型设定为:

Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+ε (1)

3.2 初步回归

首先采用OLS进行初步回归, 得到如下的回归结果:

Y=-13772.12+0.229X1-307.96X2+1.217X3+99.648X4+24.468X5-43.497X6+802.306X7

(-1.635) (28.179) (-2.217) (0.282) (1.209) (1.878) (-3.38) (9.907)

该模型的R2=0.999, 表明模型总体解释能力很强, 但是X3, X4, X5均没有通过5%的显著性水平检验, 并且X1 (人均GDP) , X2 (分配状况) , X4 (就业率) , X6 (未成年人口负担率) 和X7 (老年人口负担率) 这五个变量的方差膨胀因子均大于10, 可以看出, 变量之间存在很强的多重共线性, 因此, 本文接下来采用主成分分析对变量进行共线性的处理。

3.3 主成分分析

首先, 由于本文所选指标单位不统一, 因此要对所有评价指标进行标准化处理, 以消除量纲的影响, 然后再进行分析评价。

其次, 运用SPSS软件进行主成分分析, 得到总方差矩阵 (表1) , 前2个特征值累积贡献率达到95%, 故选择前两个新变量记为Z1和Z2 (即主成分) 来代替原来的7个变量。

在Component Matrix (成分矩阵) 中, 给出了主成分载荷矩阵, 每一列载荷值都显示各个变量与有关主成分的相关系数。以第一列为例, -0.925实际上是人均收入 (X1) 与第一个主成分的相关系数。

从成分矩阵中可以看出, X1, X2, X4, X6, X7在第一主成分上Z1的比重较大, 而X3, X5在第二主成分Z2上的比重较大, 因而将第一主成分定义为收入变量, 第二主成分定义为物价变量。

由分析可知,

Z1=0.925X1-0.909X2+0.634X3+0.962X4+0.856X5-0.974X6-0.983X7

Z2=0.201X1+0.343X2+0.751X3-0.156X4+0.459X5+0.159X6+0.067X7

3.4 主成分回归

以主成分Z1和Z2建立模型, 得到用主成分表示为:

Y=0.179*Z1-0.180*Z2

(18.471) (-3.253)

其中, R2=0.941, F=174.158, 方程整体线性关系显著;同时两个主成分均通过了5%的显著性水平检验;并且所有变量的方差膨胀因子VIF降至1.1左右, 表明多重共线性问题得到了很好的解决。将用主成分表示的模型还原为用标准化的原始变量表示的模型为:

Y=0.129X1-0.224X2-0.022X3+0.200X4+0.071X5-0.203X6-0.188X7

4 结论

由本文的研究, 可以得出如下的结论:

首先, 人均国内生产总值的上升有助于使消费需求落实为消费行为, 提高居民消费。消费需求之所以能转化为消费行为, 其根本原因在于支付能力的提升, 而提高人均GDP有助于提高消费者支付能力, 使得居民消费落到实处, 促进经济健康有序发展;其次, 我国收入分配的差距对消费者支出有显著的负向影响, 缩小我国城乡居民的收入差距, 主要是提高农村居民的收入, 成为提升我国居民有效需求, 从而拉动经济增长的重要力量;第三, 物价水平与居民消费存在显著的负相关系, 稳定物价有助于居民调整消费预期, 加快当期居民消费增长;第四, 就业率的提高能够拉动我国居民消费, 采取正确的措施, 提高居民的就业率成为促进我国经济快速增长的重要力量;最后, 未成年人口和老年人口的抚养制约了我国消费的增长, 因而, 政府采取合理的教育和医疗保障措施, 降低居民教育、生活和养老成本, 有助于提高我国居民的最终消费。

摘要:根据已有的研究, 总结影响消费的若干因素, 在此基础上进行多重共线性诊断, 并用主成分分析法消除变量之间的多重共线性, 选择主成分, 对我国居民消费进行回归, 从而得出影响我国居民消费的主要因素, 并在此基础上提出提高居民消费的建议。

关键词:主成分分析,消费,需求

参考文献

[1]万广华, 史清华, 汤树梅.转型经济中农户储蓄行为:中国农村的实证研究[J].经济研究, 2003, (5) :3-12.

[2]毛盛勇.我国居民消费需求分析[J].统计研究, 2007, (6) :48-52.

[3]邹红, 喻开志.劳动收入份额、城乡收入差距与中国居民消费[J].经济理论与经济管理, 2011, (3) :45-55.

[4]张红伟, 吴瑾.我国城乡居民消费结构的实证研究[J].大连理工大学学报 (社会科学版) , 2011, (1) :19-24.

3.主成分分析与回归分析 篇三

【关键词】主成分分析;因子分析;新指标解释

一、引言

随着数理统计理论的发展,作为它的分支的“多元统计分析方法”在近20年越来越受到人们的重视。这不仅是因为很多事情都是带有随机因素,而且在具体分析问题的时候,人们需要考虑的因素不止有一个。比如在购物的时候,我们评价商品并不是仅仅看其价格,还要关注质量、保修期等多方面的因素。在学校里,评价一个学生也是至少需要“德、智、体”三方面的指标。多元统计分析就是用统计的方法分析这种带有多指标的随机性问题。上述的例子所涉及的指标其实并不多,但更多的时候会遇到很多指标,如考察一个企业,需要了解其规模、产量、产值、税收、员工数、利润等,如果我们关注所有的指标就会大大增加分析的复杂性,而且也不宜抓住主要的因素。因此有必要对这些原始的指标数据进行降维,亦即用较少的新指标来代替原始指标,这就是主成分分析与因子分析在解决问题时所要体现的思想。可以说,出于数据降维的目的它们是没有区别。

二、具体实例分析

但是在新生成的指标的解释方面,它们还是有较大不同的。首先看一下两种方法的数学模型。主成分分析是考虑原来的指标的线性组合,把原始指标的线性组合叫做主成分。从这一点可以看出,主成分其实就是原来指标的压缩综合。而因子分析模型则是把原始指标表示成因子的线性组合(如果姑且不去考虑随机扰动的因素),也就是说因子分析的目的是要找出影响所有原始指标的内在因素。因此尽管两种方法都是对原始数据进行降维,得到新的指标,但是在对新指标的解释是有不同的。下面分析一个具体例子。该例通常出现在统计教科书中因子分析一章,但本文从主成分分析和因子分析两方面同时对其进行剖析。

考察某校学生的学习成绩状况。随机抽取了30个学生,关注起数学、物理、化学、语文、历史、英语六门课程的成绩。故形成了如下的30行、6列的原始数组。我们需要从中提炼出1,2个新指标。

通过MATLAB软件中的主成分分析与因子分析程序,可以看到通过两种方法的数据降维处理后按照累计贡献率均提炼出了两个新的指标,它们都是从上述的原始二维数组出发,计算其协方差距阵的特征值与特征向量,因此很容易搞不清楚所得到的两个新变量到底是主成分变量,还是因子变量。其实,我们此时回顾一下前文中提到的数学模型就清楚了。主成分分析是原始变量的线性组合,结合此例,即为所获得的两个新指标是原始指标的综合。又注意到原始变量前的组合系数(也叫作载荷)大小,不难发现,在其中的一个新指标中数学、物理、化学、三科占的比重比较大,因此可以把该综合指标形象地称为“理科”主成分;而在另一个新指标中语文、历史、英语三科占的比重比较大,因此可以把该综合指标形象地称为“文科”主成分。此时再考虑因子分析的模型。如前文所讲,原始变量表示成了因子的线性组合。结合此例,即数学、物理、化学、语文、历史、英语这原六个指标表示成了两个新的指标的线性组合。考虑到因子的组合系数,发现在数学、物理、化学这三科的线性表示中一个因子的组合系数比较大,而另一个比较小,因此可以把所占分量较大的那个因子形象地理解成“理性思维”因子,同样的道理可以把另一个新指标理解为“文性思维”因子。

三、总结

从此例可以看出,虽然主成分分析与因子分析都是从原始数据的协方差矩阵(有时是相关系数阵)出发,计算特征值与特征向量,按照累计贡献率大于85%的原则确定新的指标个数。但是为了避免搞混两种方法,在解释新的指标时应回馈到各自的模型上面来。即:按照主成分分析理论,新指标仅仅是原始指标的简单汇总,如果想用较少的几个变量替代原来的变量则用主成分分析;而对于因子分析,新指标则是对所有原始指标皆有影响的那些公共因子,所以当需要寻找潜在的影响要因时,倾向于用因子分析。明白了这一点,对新指标的解释也就变得顺理成章了。

【参考文献】

[1]高惠璇 应用多元统计分析 2005

[2]李静萍 谢邦昌 多元统计分析方法与应用 2008

[3]李卫东 应用多元统计分析 2008

[4]陆恒芹 苏勤 陈丽荣 女性旅游者行为特征分析及其动机研究—以西递、宏村为例 2006

[5]陆虹 用因子分析测量“护士工作满意度量表”的结构效度[期刊论文] 2007

[6]赵磊 李继海 朱大洲 籍保平 5种鹿茸营养成分的主成分分析[期刊论文] 2010

4.主成分分析与回归分析 篇四

基于主成分分析法的扬州城市生态系统评价

摘要:为了了解近年来扬州城市生态系统发展趋势,根据社会-经济-自然复合生态系统的概念,从社会、经济、自然三个方面构建了扬州城市生态系统评价指标体系,并利用主成分分析方法对扬州市-城市生态系统进行评价,结果表明扬州城市生态系统发展稳定,呈稳定上升趋势.作 者:范海燕 吕信红 刘臣辉 FAN Hai-yan LU Xin-hong LIU Chen-hui 作者单位:扬州大学环境科学与工程学院,江苏,扬州,225127期 刊:安全与环境工程 Journal:SAFETY AND ENVIRONMENTAL ENGINEERING年,卷(期):,17(3)分类号:X826关键词:城市生态系统 环境质量评价 主成分分析法 扬州

5.主成分分析与回归分析 篇五

基于主成分分析的四川省城市人居环境评价

摘要:随着经济和社会的发展,人们对人居环境的`要求也逐步提高,四川在经历了5.12大地震之后,本地居民对自身的生存环境产生了极大的关注,鉴于此,本文立足于四川省18个城市(不包括三个自治州)的基本状况,选取人居环境评价的主要指标,建立评价体系,采用主成分分析法,对研究区的评价指标进行了数据处理和分析,得出四川人居环境等级排名,旨在为各地区的规划建设和经济发展方向提供一个指导.作 者:叶超 许武成 张立立 YE Chao XU Wu-cheng ZHANG Li-li 作者单位:西华师范大学,国土资源学院,四川,南充,637002期 刊:西昌学院学报(自然科学版) Journal:JOURNAL OF XICHANG COLLEGE(NATURAL SCIENCE EDITION)年,卷(期):2010,24(2)分类号:X820.3关键词:城市人居环境 评价 主成分分析 四川省

6.主成分分析与回归分析 篇六

通过主成分分析对来源不同的29个香椿样本进行了性状研究与评价,结果表明:选优指标主要为质量指标,初步确定选优的形质指标为芽鳞颜色、芽鳞茸毛、初出嫩叶颜色、小叶形态、小叶光泽油亮程度情况、复叶柄颜色、小叶柄颜色、小叶排列紧密状况,在此基础上,选出了16个优良单株,并进行元性系繁殖,为香椿的性状评价、优株选择和繁殖提供了理论基础与实践经验.

作 者:雷小华 涂炳坤 王茂丽 何丹 LEI Xiao-hua TU Bing-kun WANG Mao-li HE Dan 作者单位:雷小华,LEI Xiao-hua(华中农业大学园艺林学学院,武汉,430070;湖北省林业科学研究院,武汉,430079)

涂炳坤,王茂丽,何丹,TU Bing-kun,WANG Mao-li,HE Dan(华中农业大学园艺林学学院,武汉,430070)

7.主成分分析与回归分析 篇七

负荷预测的核心问题是预测的技术方法,或者说是预测时所用的数学模型。目前国内外主要的预测方法包括主成分分析法(PCA)[1]、向量自回归(VAR)分析法[2]、协整检验[3]和格兰杰因果检验[4,5]、参数回归分析法[6]、支持向量机分析法[7]等。文献[8,9]提出组合主成分分析法与BP神经网络分析法,根据主成分贡献率对空间进行约简,提取线性无关的输入变量,以此达到压缩变量维数的目的,然后利用考虑模型输入变量相互关系的递推合成BP神经网络进行预测。但是这种方法在对原始数据的处理上没有考虑不同滞后几期对预测结果的影响,也就是说当相关因素发生变化时,对发电量的影响要滞后1个月、2个月甚至几年才能体现。而国内外的负荷预测研究中,很少有人将滞后期考虑在内。因此在进行预测分析时将滞后期考虑在内是十分必要的。

本文针对这一问题,将格兰杰因果检验与主成分相结合,根据格兰杰检验结果对原始数据进行滞后处理,然后再进行预测分析,最后通过实例分析证实了该方法的有效性。

1 带滞后期回归的基本原理

本文首先进行原理分析,然后进行实证分析,其研究流程如图1所示。

1.1 原始数据的处理

对原始数据进行处理,处理过程如下[4,10]:

首先对原始数据x进行二次平滑,平滑公式为:

对第二次平滑序列进行线性预测得出新的预测序列yi+6,然后通过该序列计算季节指数βi+6:

由于存在季节波动,必须对其进行调整,调整公式如下:

根据调整后的季节指数计算波动值ki+6:

最后计算得残值序列Ri+6:

1.2 单位根检验

在单位根(ADF)检验中,一般有2个滞后差分项的等式为[2]:

式中:εt为白色噪声误差项;yt为时间序列;Δyt为时间序列的一阶差分项;β1、β2、β3、β4、β5为常数项;T为时间趋势项;yt-1、yt-2为滞后差分项。

在EViews软件中,ADF检验有3种情况:1)回归方程中包含1个常数项;2)回归方程中包含1个线性时间趋势;3)回归方程中包含多个滞后差分项[2]。

在这3种情况中,ADF检验都是对回归方程中yt-1的系数进行平稳性检验,然后显示ADF检验结果,其结果应包含ADF统计量(检验滞后变量系数)和判断平稳性的临界值。如果yt-1的检验系数小于零,则拒绝yt包含单位根的原假设,从而接受序列yt平稳的备择假设。也就是说如果ADF统计量小于或等于临界值,那么序列yt是平稳的。如果ADF统计量比临界值大,那么序列yt是非平稳的。

1.3 格兰杰因果检验

格兰杰因果检验核心思想是若时间序列yt通过采用xt的历史数据可以提高预测效果,则说明存在从xt到yt的因果关系,否则不存在。传统的格兰杰因果检验的原假设是不存在从xt到yt的因果关系[4,5]。检验关系式如下:

式中:P1、P2为变量的滞后长度。

式(7)的原假设是不存在从xt到yt的因果关系,若β1j是联合显著的,则拒绝原假设。同样,式(8)的原假设是不存在从yt到xt的因果关系,若β2j是联合显著的,则拒绝原假设,表明存在从yt到xt的因果关系。

1.4 主成分分析

主成分分析是指在维持原序列信息基本不变的前提下,利用原序列的1个或多个线性组合来替代原序列并挖掘原序列之间数学关系的一种计量分析方法[8,9]。其数学模型为[8]:

假设有n个观察对象,每个观察对象观测P项指标:x1,x2,…,xP,那么,原始数据的矩阵形式为:

式中:xnp为第n个观察对象的第P个指标的观测值。

如果用x1,x2,…,xp来表p个指标,则x1,x2,…,xp的线性组合可以用1组新的变量Z1,Z2,…,Zp来表示:

如果系数aij满足,i=1,2,…,p而且系数aij的确定使Z与Zj(i≠j)独立,并让Z1在x1,x2,,xp的一切线性组合中的方差最大,让Z2与Z1独立…且在x1,x2,…,xp的一切线性组合中的方差最大,同理,让Zp与Z1,Z2,…,Zp都独立且在x1,x2,…,xp的一切线性组合中的方差最大,那么就认为Z1,Z2,…,Zp是原变量的第一、第二及至第p主成分。

主成分的求解可以通过以下3个步骤来处理[9]。

(1)观测得出样本矩阵

式中:i为样本数;j为变量数。

将原始数据标准化后得:

(2)观测对象的相关系数矩阵

用雅克比方法计算特征方程,求出与相关系数矩阵R对应的p个非负的特征值,并一一对应特征值:λ1>λ2>…>λp,≥0,则相应的λi的特征向量A(i)为:

并满足:

(3)第m个主成分的累积方差

累积方差α最接近于1的第m个因子为第m主成分,据此选择前面m个因子作为第一主成分、第二主成分及至第m主成分。通过这样的变换,解释因子由p个减少为m个,达到了筛选因子的目的。

2 实例分析

实证的具体过程如图2所示。

影响电力负荷预测的因素有很多,主要有电力消费结构、经济发展水平及经济结构的调整、收入水平及消费观念等。本文选用全行业用电量和城乡居民生活用电量表示电力消费结构,用社会消费品零售总额和出口商品总额代表经济发展水平,用全国居民消费价格指数代表收入水平及消费观念。

采用2004年1月到2012年12月共108个月的中国发电量及其相关的5个因素作为分析数据,预测2012年1月到12月的发电量。图3为发电量与各相关因素关系图,图3中Y表示发电量,X1表示全行业用电量,X2表示城乡居民生活用电量,X3表示社会消费品零售总额,X4表示出口商品总额,X5表示全国居民消费价格指数。

首先对其进行相关性分析(表1),从表1中可以看出Y与X1,X2,X3,X4有很大的相关性,相关系数均大于0.9,而与X5相关性较弱,相关系数为0.235 5;X1,X2,X3,X4,X5之间的相关性也很大,如果直接进行多元线性回归必然会产生多重共线性。

在进行主成分分析之前,进行格兰杰因果检验,计算出各序列的残值序列。

进行因果检验的前提是对时间序列进行ADF平稳性检验,表2给出了对残值进行平稳性检验的结果。从表2中可以看出,6个时间序列在无趋势项和截距项时都是平稳的。为保证检验的可靠性,另外用菲利普斯-配荣检验法(Plhillips-Perron Test,PP)对6个时间序列在无趋势项和截距项时的平稳性进行验证(表3),从表3可以看出6个时间序列在无趋势项和截距项时都是平稳的。因此可以直接对残值序列进行格兰杰因果检验。

不同的滞后期对序列的因果关系检验结果影响很大,由于我们研究的是月度数据,根据经验,月度数据平稳性检验滞后12期即可[4],但是为保证结果可靠性,总共做了滞后24期的格兰杰因果关系检验。而最多在滞后12期时各时间变量对发电量的影响均显著,另外,由于本文是考察各时间序列对发电量的影响,因此表4只列出了滞后12期的检验结果和各时间变量对发电量的格兰杰检验P值。检验的原假设是自变量不是因变量的原因,这里,自变量是各个序列,因变量是发电量。从表4中可以看出,在滞后期为12时全行业用电量是发电量的格兰杰原因,在滞后期为6时城乡居民用电量是发电量的格兰杰原因,在滞后期为1时社会消费品零售总额、出口商品总额、全国居民消费价格指数是发电量的格兰杰原因。

根据滞后期不同,采用各个序列不同滞后期的原始数据进行主成分分析,发电量采用2005年1月到2012年12月的数据,而全行业用电量采用2004年1月到2011年12月的数据,城乡居民生活用电量采用2004年7月到2012年6月的数据,社会消费品零售总额、出口商品总额和全国居民消费价格指数采用2004年12月到2012年11月的数据,分析结果如表5所示。

从表5可以看出应该选择第1主成分和第2主成分作为回归因子,因为第1主成分占总方差的73.17%,第2主成分占总方差的19.46%,前2个成分占总方差的92.63%,因此选择第1、2主成分作为回归因子。这一点从图4中可直观地看出。

选择第1、2主成分后,根据表6选择第1,2主成分的线性组合系数来进行回归分析,根据组合系数得出新的序列Z1、Z2,序列计算方法如下:

由此,将Z1,Z2作为自变量,发电量Y作为因变量进行多元回归分析,得到回归方程。

至此,得出预测方程亦即回归方程。为保证预测结果的可比较性,另外采用不作滞后处理的主成分回归和VAR方法进行预测,预测结果如表7所示。

根据表7所得数据计算月发电量预测准确率,计算公式为[11]:

其中,

式中:LFi、LRi分别为负荷的预测值和实际值;Ei为单点负荷的相对预测误差。

使用本文方法预测的月发电量预测准确率为91.93%,而用不做处理的向量自回归方法和主成分回归方法所预测的月发电量预测准确率分别为91.08%、85.61%。相对而言,本文的改进主成分分析法具有更高的预测精度。

3 结论

本文结合格兰杰因果检验和主成分回归分析法对电力负荷进行了预测,利用不同滞后期对因果检验不同这一特点,对原始数据进行处理,采用主成分回归分析,避免了因多元变量特征变异程度差异而引起的信息丢失,准确反映了原始数据所包含的信息,提高了预测精度。

很多电力负荷预测的实质是相同的,当选择的因素足够多时各种方法的精度相差无几。在这种情况下直接采用线性回归法是最简单成熟的方法。利用滞后期进行主成分分析不仅可以避免多重共线性,而且可以根据滞后期的不同进行提前预测,文中算例结果表明这是一种较理想的预测方法。

参考文献

[1]王晓林.统计学[M].北京:经济科学出版社,2001.

[2]张晓峒.Eviews使用指南与案例[M].北京:机械工业出版社.2006.

[3]牛东晓,嵇灵,劳永昶,等.中国电力消费与经济增长关系的实证研究[J].统计与决策,2013,2(374):140-142.

[4]ANDREA V.Granger Non-causality Tests Between(non)Renewable Energy Consumption and Output in Italy Since1861:The Relevance of Structural Breaks[J].Energy Policy,2012,(45):226-236.

[5]GALIP A,ERDAL K.Electricity Consumption and Economic Growth:Evidence from Turkey[J].Energy Economics,2005,(27):849-856.

[6]杨丽徙,张永锋,许向伟,等.半参数回归分析法在电力负荷预测中的应用[J].郑州大学学报,2010,3(31):29-32.

[7]张亚军,刘志刚,霍柏超,等.基于支持向量机的电力负荷组合预测模型叨.电力需求侧管理,2007,9(2):14-17.

[8]王志征,余岳峰,姚国平.主成分分析法在电力负荷预测中的应用[J].电力需求侧管理,2003,3(5):21-24.

[9]吕佳.基于主成分分析的短期负荷预测模型[J].重庆师范大学学报,2007,3(24):33-36.

[10]李钷,李敏,刘涤尘.基于改进回归法的电力负荷预测[J].电网技术,2006,1(30):99-104.

8.利率期限结构主成分分析 篇八

关键词:国债收益率;主成分分析;固定收益证券;利率期限结构;套期保值

中图分类号:F830.8 文献标识码:A 文章编号:1006-8937(2014)29-0108-03

一个国家的国债收益率一向是重要的指标,从宏观经济上看,国债收益率高说明市场经济走势好,稳定增长,投资回报稳定,投向国债的资金少;利率低说明宏观经济开始波动,市场对经济前景不看好,大量资金涌向国债。

从货币政策上看,如果国家执行稳健的货币政策,国债利率稍高,如果因为刺激经济执行宽松的货币政策,降低利率,这样国债利率也会降低。

因此我们对我国国债收益率曲线的变动模式进行探究,找出其主要受到哪些因素的影响,以及其收益率曲线的主要波动方式。

同时,我们试图找出可以更加准确的衡量债券的利率风险的方法,以达到更好的套期保值效果。

1 理论基础

Nelson-Siegel模型是一种通过参数模型来描述曲线动态变化的方法,大量应用于利率期限结构的估计中,由Nelson和Siegel在1987年提出。瞬时远期利率可以用包含参数的如下模型来描述:

由于R(t,x)是f(t,x)的一种积分,因此两者的图形属性一定是一致的,为了研究?茁0、?茁1、?茁2的性质,我们可以对τ取一个假定值,得到R(t,x)相对?茁0、?茁1、?茁2的偏导数。

式中,?茁0是R(t,x)在期限t趋于无穷大时的渐进值,其变动整体改变利率期限结构的水平高度,可以理解为“水平因子”;?茁1参数可以理解为“斜率因子”;?茁2参数可以理解为“曲率因子”;τ参数,在其他参数固定不变的情况下,决定了收益率曲线第一次驼峰出现的时间。

2 系统设计与实现

2.1 求取最佳τ取值

由于Nelson-Siegel模型中?茁0、?茁1、?茁2、τ参数之间的关系,在对期限结构进行估计时,需要选取合适的τ的取值,这里采用试值法。

分别取τ=0.5,1,1.5,…,5,6,7,8,9,10,15,20,25,30对公式(2)进行最小二乘估计,选取综合来看残差平方和最大,R最小的值。

2.2 估计收益率

根据得到的τ值以及方程式,我们分别对2013年8月到2014年5月的收益率进行模拟,得到不同年限的N-S估计利率。

2.3 利率期限结构的主成分分析

将EVIEWS中所构建的N-S模型所估计得到的利率期限结构数据导入SPSS软件中,选取所有变量进行主成分分析,得到了各变量的方差贡献率,得到显著的变量并整理。记录主成分的方差贡献率以及累计方差贡献率,代表原始多维数据进行统计分析。此外,根据三个主成分的成分矩阵可以作出利率变动的主成分分析表,见表1。

3 实验结果

3.1 数据分析

以2014年2月28日得到的国债数据作为样本,制作下表,见表2,并且由表中我们知道最佳的τ取值是8。

我们对从2013年8月31日至2014年5月31日中每月末取得的国债数据进行计算,从而到不同τ下的?茁0、?茁1和?茁2,通过选取最大的残差平方和以及最小的R2,得到最佳的τ。

例如,2013年8月30日得到最佳的τ,τ=1,此时得到的方程为:

4.196166+7.229851×(1-exp(-t))/(t)-14.65054×((1-exp

(-t))/(t)-exp(-t)) (3)

2013年9月29日得到最佳的τ,τ=3,此时得到的方程为:

4.414798-1.352335×(1-exp(-t/3))/(t/3)-2.440788×((1-exp

(-t/3))/(t/3)-exp(-t/3))(4)

2013年10月30日得到最佳的τ,τ=3,此时得到的方程为:

4.450086-1.459816×(1-exp(-t/3))/(t/3)-2.294317×

((1-exp(-t/3))/(t/3)-exp(-t/3))(5)

3.2 估计收益率

每月末0.05年至30年N-S估计利率见表3。

3.3 利率期限结构的主成分分析

所得各变量的方差贡献率见表4。

4 结 语

从以上实验结果中可以看出,我国国债收益率曲线的变动模式也主要受到三个因素的影响,且收益率曲线的波动方式主要有三种形式:平行移动、斜率变动、曲率变动。

同时,通过主成分分析得到了影响利率期限结构变动的三个主成分,在一定程度上解释了利率非平行移动的原理,在此基础上构建的主成分久期相对于麦考利久期和修正久期而言,就可以更加准确的衡量债券的利率风险,达到更好的套期保值效果。

参考文献:

[1] 萨利赫N·内夫茨(美).金融工程:金融工程原理(第1版)[M].北京:人民邮电出版社,2009.

摘 要:文章通过Nelson-Siegel模型描述我国国债收益率曲线的变动模式,依据β0、β1、β2、τ取得的最佳值建立方程式,进行不同期限的N-S估计利率分析,以及利率期限结构的主成分分析,得出我国国债收益率进行主要受到三个因素的影响,且收益率曲线的波动方式主要有三种形式:平行移动、斜率变动、曲率变动。这三个主成分在一定程度上解释了利率非平行移动的原理,因此在此基础上构建的主成分久期相对于麦考利久期和修正久期而言,就可以更加准确的衡量债券的利率风险,达到更好的套期保值效果。

关键词:国债收益率;主成分分析;固定收益证券;利率期限结构;套期保值

中图分类号:F830.8 文献标识码:A 文章编号:1006-8937(2014)29-0108-03

一个国家的国债收益率一向是重要的指标,从宏观经济上看,国债收益率高说明市场经济走势好,稳定增长,投资回报稳定,投向国债的资金少;利率低说明宏观经济开始波动,市场对经济前景不看好,大量资金涌向国债。

从货币政策上看,如果国家执行稳健的货币政策,国债利率稍高,如果因为刺激经济执行宽松的货币政策,降低利率,这样国债利率也会降低。

因此我们对我国国债收益率曲线的变动模式进行探究,找出其主要受到哪些因素的影响,以及其收益率曲线的主要波动方式。

同时,我们试图找出可以更加准确的衡量债券的利率风险的方法,以达到更好的套期保值效果。

1 理论基础

Nelson-Siegel模型是一种通过参数模型来描述曲线动态变化的方法,大量应用于利率期限结构的估计中,由Nelson和Siegel在1987年提出。瞬时远期利率可以用包含参数的如下模型来描述:

由于R(t,x)是f(t,x)的一种积分,因此两者的图形属性一定是一致的,为了研究?茁0、?茁1、?茁2的性质,我们可以对τ取一个假定值,得到R(t,x)相对?茁0、?茁1、?茁2的偏导数。

式中,?茁0是R(t,x)在期限t趋于无穷大时的渐进值,其变动整体改变利率期限结构的水平高度,可以理解为“水平因子”;?茁1参数可以理解为“斜率因子”;?茁2参数可以理解为“曲率因子”;τ参数,在其他参数固定不变的情况下,决定了收益率曲线第一次驼峰出现的时间。

2 系统设计与实现

2.1 求取最佳τ取值

由于Nelson-Siegel模型中?茁0、?茁1、?茁2、τ参数之间的关系,在对期限结构进行估计时,需要选取合适的τ的取值,这里采用试值法。

分别取τ=0.5,1,1.5,…,5,6,7,8,9,10,15,20,25,30对公式(2)进行最小二乘估计,选取综合来看残差平方和最大,R最小的值。

2.2 估计收益率

根据得到的τ值以及方程式,我们分别对2013年8月到2014年5月的收益率进行模拟,得到不同年限的N-S估计利率。

2.3 利率期限结构的主成分分析

将EVIEWS中所构建的N-S模型所估计得到的利率期限结构数据导入SPSS软件中,选取所有变量进行主成分分析,得到了各变量的方差贡献率,得到显著的变量并整理。记录主成分的方差贡献率以及累计方差贡献率,代表原始多维数据进行统计分析。此外,根据三个主成分的成分矩阵可以作出利率变动的主成分分析表,见表1。

3 实验结果

3.1 数据分析

以2014年2月28日得到的国债数据作为样本,制作下表,见表2,并且由表中我们知道最佳的τ取值是8。

我们对从2013年8月31日至2014年5月31日中每月末取得的国债数据进行计算,从而到不同τ下的?茁0、?茁1和?茁2,通过选取最大的残差平方和以及最小的R2,得到最佳的τ。

例如,2013年8月30日得到最佳的τ,τ=1,此时得到的方程为:

4.196166+7.229851×(1-exp(-t))/(t)-14.65054×((1-exp

(-t))/(t)-exp(-t)) (3)

2013年9月29日得到最佳的τ,τ=3,此时得到的方程为:

4.414798-1.352335×(1-exp(-t/3))/(t/3)-2.440788×((1-exp

(-t/3))/(t/3)-exp(-t/3))(4)

2013年10月30日得到最佳的τ,τ=3,此时得到的方程为:

4.450086-1.459816×(1-exp(-t/3))/(t/3)-2.294317×

((1-exp(-t/3))/(t/3)-exp(-t/3))(5)

3.2 估计收益率

每月末0.05年至30年N-S估计利率见表3。

3.3 利率期限结构的主成分分析

所得各变量的方差贡献率见表4。

4 结 语

从以上实验结果中可以看出,我国国债收益率曲线的变动模式也主要受到三个因素的影响,且收益率曲线的波动方式主要有三种形式:平行移动、斜率变动、曲率变动。

同时,通过主成分分析得到了影响利率期限结构变动的三个主成分,在一定程度上解释了利率非平行移动的原理,在此基础上构建的主成分久期相对于麦考利久期和修正久期而言,就可以更加准确的衡量债券的利率风险,达到更好的套期保值效果。

参考文献:

[1] 萨利赫N·内夫茨(美).金融工程:金融工程原理(第1版)[M].北京:人民邮电出版社,2009.

摘 要:文章通过Nelson-Siegel模型描述我国国债收益率曲线的变动模式,依据β0、β1、β2、τ取得的最佳值建立方程式,进行不同期限的N-S估计利率分析,以及利率期限结构的主成分分析,得出我国国债收益率进行主要受到三个因素的影响,且收益率曲线的波动方式主要有三种形式:平行移动、斜率变动、曲率变动。这三个主成分在一定程度上解释了利率非平行移动的原理,因此在此基础上构建的主成分久期相对于麦考利久期和修正久期而言,就可以更加准确的衡量债券的利率风险,达到更好的套期保值效果。

关键词:国债收益率;主成分分析;固定收益证券;利率期限结构;套期保值

中图分类号:F830.8 文献标识码:A 文章编号:1006-8937(2014)29-0108-03

一个国家的国债收益率一向是重要的指标,从宏观经济上看,国债收益率高说明市场经济走势好,稳定增长,投资回报稳定,投向国债的资金少;利率低说明宏观经济开始波动,市场对经济前景不看好,大量资金涌向国债。

从货币政策上看,如果国家执行稳健的货币政策,国债利率稍高,如果因为刺激经济执行宽松的货币政策,降低利率,这样国债利率也会降低。

因此我们对我国国债收益率曲线的变动模式进行探究,找出其主要受到哪些因素的影响,以及其收益率曲线的主要波动方式。

同时,我们试图找出可以更加准确的衡量债券的利率风险的方法,以达到更好的套期保值效果。

1 理论基础

Nelson-Siegel模型是一种通过参数模型来描述曲线动态变化的方法,大量应用于利率期限结构的估计中,由Nelson和Siegel在1987年提出。瞬时远期利率可以用包含参数的如下模型来描述:

由于R(t,x)是f(t,x)的一种积分,因此两者的图形属性一定是一致的,为了研究?茁0、?茁1、?茁2的性质,我们可以对τ取一个假定值,得到R(t,x)相对?茁0、?茁1、?茁2的偏导数。

式中,?茁0是R(t,x)在期限t趋于无穷大时的渐进值,其变动整体改变利率期限结构的水平高度,可以理解为“水平因子”;?茁1参数可以理解为“斜率因子”;?茁2参数可以理解为“曲率因子”;τ参数,在其他参数固定不变的情况下,决定了收益率曲线第一次驼峰出现的时间。

2 系统设计与实现

2.1 求取最佳τ取值

由于Nelson-Siegel模型中?茁0、?茁1、?茁2、τ参数之间的关系,在对期限结构进行估计时,需要选取合适的τ的取值,这里采用试值法。

分别取τ=0.5,1,1.5,…,5,6,7,8,9,10,15,20,25,30对公式(2)进行最小二乘估计,选取综合来看残差平方和最大,R最小的值。

2.2 估计收益率

根据得到的τ值以及方程式,我们分别对2013年8月到2014年5月的收益率进行模拟,得到不同年限的N-S估计利率。

2.3 利率期限结构的主成分分析

将EVIEWS中所构建的N-S模型所估计得到的利率期限结构数据导入SPSS软件中,选取所有变量进行主成分分析,得到了各变量的方差贡献率,得到显著的变量并整理。记录主成分的方差贡献率以及累计方差贡献率,代表原始多维数据进行统计分析。此外,根据三个主成分的成分矩阵可以作出利率变动的主成分分析表,见表1。

3 实验结果

3.1 数据分析

以2014年2月28日得到的国债数据作为样本,制作下表,见表2,并且由表中我们知道最佳的τ取值是8。

我们对从2013年8月31日至2014年5月31日中每月末取得的国债数据进行计算,从而到不同τ下的?茁0、?茁1和?茁2,通过选取最大的残差平方和以及最小的R2,得到最佳的τ。

例如,2013年8月30日得到最佳的τ,τ=1,此时得到的方程为:

4.196166+7.229851×(1-exp(-t))/(t)-14.65054×((1-exp

(-t))/(t)-exp(-t)) (3)

2013年9月29日得到最佳的τ,τ=3,此时得到的方程为:

4.414798-1.352335×(1-exp(-t/3))/(t/3)-2.440788×((1-exp

(-t/3))/(t/3)-exp(-t/3))(4)

2013年10月30日得到最佳的τ,τ=3,此时得到的方程为:

4.450086-1.459816×(1-exp(-t/3))/(t/3)-2.294317×

((1-exp(-t/3))/(t/3)-exp(-t/3))(5)

3.2 估计收益率

每月末0.05年至30年N-S估计利率见表3。

3.3 利率期限结构的主成分分析

所得各变量的方差贡献率见表4。

4 结 语

从以上实验结果中可以看出,我国国债收益率曲线的变动模式也主要受到三个因素的影响,且收益率曲线的波动方式主要有三种形式:平行移动、斜率变动、曲率变动。

同时,通过主成分分析得到了影响利率期限结构变动的三个主成分,在一定程度上解释了利率非平行移动的原理,在此基础上构建的主成分久期相对于麦考利久期和修正久期而言,就可以更加准确的衡量债券的利率风险,达到更好的套期保值效果。

参考文献:

9.主成分分析与回归分析 篇九

选定河北省张家口地区34个地下水质站点9年资料,在SPSS统计软件的支持下,将主成分分析方法应用于水环境的.综合评价之中.利用主成分综合得分从评价分区、河流水系、同一水系的相邻站点上进行时空变化分析,分析结果理想,体现了主成分分析在水环境质量评价中的实用性.

作 者:李哲强 侯美英 白云鹏 作者单位:李哲强(河北省水文水资源勘测局,河北,石家庄,050031)

侯美英,白云鹏(张家口市水文水资源勘测局,河北,张家口,075000)

10.主成分分析与回归分析 篇十

凌志400轿车尾气成分的分析与研究

随着车辆的急剧增加,其产生的废气污染日益严重,人类的生态环境也受到越来越严重的威胁,而控制好轿车尾气排放的含量,对人类的身体健康以及生态环境就是很有必要的`,因此要严格控制好尾气的含量.

作 者:陈娜娜  作者单位:天津机电职业技术学院,天津,300457 刊 名:科技创新导报 英文刊名:SCIENCE AND TECHNOLOGY INNOVATION HERALD 年,卷(期):2009 “”(26) 分类号:U473.9 关键词:尾气   超标   分析研究  

11.主成分分析与回归分析 篇十一

关键词 橡胶树 ;适宜性 ;种植 ;主成分分析

分类号 S794.1

Abstract This paper selects the soil and climate resources, according to the previous research results and the expertise to determine the evaluation factor. Use the fuzzy mathematical method to quantify the evaluation factors, and then evaluated the planting suitability of rubber in Danzhou City by the method of principal component analysis. The results showed that the most suitable area for rubber planting is 43 029.58 ha, accounting for 14.99 % of the total agricultural land in Danzhou City; the suitable area for planting is 57 770.90 ha, accounting for 20.12 %; the less suitable area for planting is 40 934.9 ha, accounting for 14.26 %. The evaluation results not only bring the maximum benefit of the rubber at the macro, but also provide a reference for the zoning of the rubber plantations in Danzhou City.

Keywords rubber tree ; suitability ; planting ; principal component analysis

橡胶是关乎国计民生和国防安全的重要战略物资,是四大工业原料中唯一可再生的资源[1]。海南省是我国最大的天然橡胶生产基地,橡胶产业不仅是海南农民的重要经济来源,也是海南省的基础产业、支柱产业和优势产业[2]。随着我国人民的生活水平日益提高以及经济全球化和区域经济一体化,人们对天然橡胶的需求随之增加。面临国际市场的竞争,如何在有限的土地上将橡胶的效益最大化,且最大限度地保护土壤资源、挖掘农业资源的潜力,已成为橡胶生产管理部门迫切需要解决的问题[3]。虽然近年来海南橡胶种植的发展势头良好,但是在橡胶种植生产中还存在着一些问题:有些农户仍然过着靠天吃饭的日子或者凭着经验从事橡胶生产,有些农户由于文化素质较低而大量的施肥以片面地追求产量。这些生产模式并非是最好的,还忽略了生态效益;再有儋州市的橡胶实际种植面积及产量位居海南省(农垦除外)第一,但是平均产量却位居全省第六[4]。为了实现橡胶产量的提高,且在不增加种植面积的情况下,增加橡胶的总产量,这就要求逐步提高橡胶的单产。因此,因地制宜地种植橡胶已成为海南橡胶种植管理的热点。

鉴于上述原因,本研究针对海南省儋州市的橡胶种植进行了适宜性分析评价,以提高橡胶的单产,实现橡胶生产的经济效益最大化,增加农民的收入。通过橡胶种植的适宜性评价为橡胶种植区划作出理论依据,为农业管理者提供科学准确的区划参考。

1 材料与方法

1.1 材料

儋州市位于海南岛的西北部,是海南省土地面积最大、人口最多的市(县级市),它濒临北部湾,地处东经108°56′~109°46′,北纬19°11′~19°52′,是海南西部的经济、交通、通信和文化中心。儋州市陆地面积3 265 km2,人口106.86万(2010年底)[4]。由于地处东亚大陆季风气候的南缘,属热带季风气候。年平均气温23.3℃,年平均日照时数在2 000 h以上,西部沿海日照达2 500 h左右;降雨量充沛:全市各地降雨量为900~2 500 mm/a,平均降雨量为1 800 mm/a;全市全年雨量分布不均,冬春季节雨量稀少,夏秋季节雨量充沛。全市地表年径流量达到189亿m3。全市全年水热资源丰富,适宜多种农作物生长繁殖。2010年全市热带作物面积46 646 hm2,其中橡胶种植面积45 605.07 hm2[4]。

空间数据:1∶50 000儋州市行政区界图、土壤类型图、土地利用现状图、数字高程模型等;

文本数据:儋州市气象统计数据、儋州市“测土配方施肥”项目的采样调查分析结果,包括采样点坐标、基本情况、土壤农化分析数据,以及儋州市其他相关资料与数据。

1.2 数据处理方法

数据处理软件:SPSS 统计分析软件、GIS 地理信息系统软件。

2 结果与分析

2.1 基于主成分方法的橡胶种植适宜性评价

2.1.1 评价单元的划分

评价单元是橡胶种植适宜性评价的最基本单元,本研究的评价单元划分采用土壤图、土地利用现状图、行政区划图叠置构成。相同的土壤类型、土地利用现状及行政区划组成一个评价单元,以便于评价结果的应用。其中土壤类型划分到土属,土地利用现状提取农用地,行政区划划分到行政村。通过叠加分析处理后得到儋州市的11 761个评价单元。

nlc202309011624

2.1.2 评价指标的选取及量化

参评的指标主要分为两类:一类是连续型指标(即定量化的指标),包括土壤养分值、土层厚度、容重、风速、降雨量等;一类是离散型指标(即定性、概念型指标),包括质地,成土母质、剖面构型等。由于参评指标不能够简洁地表明该因素对橡胶适宜性影响的大小,所以本研究采用“隶属度”来界定[5]。

2.1.2.1 隶属函数

由于参评的指标是渐变的,固本文采用模糊数学的方法来建立隶属函数。根据前人的研究经验和数学原理来建立函数,为了避免计算时零值过多,隶属函数定为0.1~1.0,最大值1.0表示该指标完全适合作物生长,最低值0.1表示该指标不利于作物生长。建立相应的函数模型[6-8]:

2.1.2.2 指标的选择以及指标临界值的确定

根据橡胶正常生长对环境条件的相关研究,结合专家经验法和理论分析,确定各评价因子的隶属函数的临界值和阈值及散点型函数的隶属度[9-13]。如表1。

2.1.3 评价因子属性数据库建立

利用儋州市各气象站点的空间位置(纬度、经度)及其观测的数据,建立风速、年降水量数据库。采用反距离权重插值模型对气候要素数据进行模拟空间处理,建立风速、年降水量等栅格空间数据库。利用儋州市DEM模型,借助GIS 相关模块自动生成坡度、坡向、海拔高度等地形因子栅格空间及其属性数据库。利用土壤普查、测土配方施肥调查样点的资料和DEM模型,建立调查样点及其相关属性数据库。采用克里格插值法生成儋州市土壤耕层有机质、有效磷、速效钾等栅格数据库;利用ArcGIS进行区域统计,作为评价单元相关因子的属性数据。

2.1.4 主成分分析的计算步骤

(1)各量化指标数据标准化

将采集p维随机向量x=(x1,x2,...,xp)T)n个样品

xi=(xi1,xi2,...,xipT ,i=1,2,…,n,n>p,构造成样本阵,接着对样本阵元进行标准化转换;如下:zij=,i=1,2,…,n;j=1,2,…,p;其中=≥, 得到标准化阵Z。

(2)按照公式R=|Tij|pxp=;其中,rij=,i,j=1,2,…,p;求标准化阵Z的相关系数,并构造相关系数矩阵R。

(3)计算出样本的相关系数矩阵R的特征方程|R-λIp|=0得m个特征根,确定主成分的个数。按≥0.85确定所需的m值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量b0j。

(4)根据Uij=ZTiB0j,j=1,2,...,m;其中:U1为第一主成分;U2为第二主成分;…,Up为第p主成分。计算各个主成分的得分。

(5)对求得的m个主成分分别进行评价,得到m个主成分的评价分值。再将每个主成分的评价分值与每个主成分的方差贡献率(即权重)相乘累加,计算评价的综合得分。

2.1.5 评价结果

根据指标的临界值和阈值及散点型函数的隶属度,将指标全部通过隶属函数量化于同一水平上。然后利用数据分析软件SPSS16.0和Excel完成主成分分析的相关计算。得到橡胶主成分分析对应的特征根、贡献率及其累计方差贡献率(表2)。

从表2可以看出,当m=8时,累计方差贡献率85.207%>85%,因此可以利用前8个主成分代替原变量进行分析[14]。从表2可知,橡胶的8个主成分与全部的14个指标的线性关系公式为:

根据评价函数模型,将评价单元数据代入上述公式中,计算每个评价单元的综合F值。将所有评价单元的综合得分F作累积频率曲线,并把频率曲线的拐点作为相邻等级的临界值[15]。以最适宜、适宜、次适宜和不适宜对橡胶适宜性综合指数进行归类,从而对适宜性进行定性评价。橡胶的适宜性划分标准见表3。

在橡胶种植适宜性综合指数划分基础上,遵循种植区集中连片且顾及行政区划界线等原则,结合海南限制橡胶生长的自然环境条件:高程高于300 m,风速高于3 m/s[10]等。将评价单元进行适宜性定性评价,并在GIS中,将评价单元图与定性评价结果相衔接,最后得到儋州市橡胶适宜性面积统计表(表4)及适应性评价结果图(图1、2)。

2.1.6 结果分析

从图1可以看出,儋州市中部区域橡胶种植适宜性较高,从中间往东南、西北两边呈适宜递减趋势。橡胶种植适宜区域主要集中在那大镇附近,不适宜区主要集中在沿海及松涛水库附近。

结合表4和图1,可以清楚的看到儋州市橡胶种植的适宜区域:

(1)最适宜区域。橡胶种植最适宜区域的面积为43 029.58 hm2,占农用地面积的14.99%。此类区域分布较为集中,主要分布在大成、和庆、那大、南丰四镇以及八一、兰洋、西联、西流、西培、西庆等农场。此区域农用地的主要特点是地势平坦、土层较厚、风速较小、降雨量充足、土壤酸碱度适宜且养分充足。对于此类农用地,应当切实加强保护,尽量避免建设用地等占用此类耕地,同时注意做好养地,合理调整化肥施用量和投入比,防止土壤酸化和盐渍化。

(2)适宜区域。橡胶种植适宜区域的面积为57 770.9 hm2,占农用地面积的20.13%。此类耕地主要分布在大成、和庆、那大、雅星等乡镇以及西华、西联、西流、西培、西庆、新盈等农场。此类农用地环境与最适宜区域农用地相差不大,影响橡胶种植的不利因素主要是水和养分,尤其是有机质和全氮等养分的含量不高,处于中等或中等偏下水平。由于适宜种植面积较最适宜面积广,因此加强此类耕地的管理和保护是儋州市实现橡胶高产、稳产的保证。针对适宜耕地养分特别是有效磷含量低的特点,可因时适量增加磷肥用量,合理调配复合肥比例,以提高土壤有效磷含量,改善土壤养分结构,达到以磷增氮的效果,消除农业生产中的不利因素。

nlc202309011624

(3)次适宜区域。次适宜种植橡胶的面积为40 934.9 hm2,占14.26%;该类农用地集中分布在雅星、王五、东城、光村、峨蔓、木棠等乡镇以及红岭、西华、西联、新盈等农场。其影响橡胶种植的不利因素主要是降水量较小、风速较大、土壤养分含量不高,虽然其地势较低,但最重要的是此类土壤有机质和全氮等养分含量低,难以维持橡胶正常生长的生理需要。对于此类区域可以选择抗风性较强的橡胶品种种植,并且加强农田水利设施的建设,调节水分状况,增施有机肥等,使之满足橡胶生长需要。

(4)不适宜区域。不适宜种植橡胶的面积为145 317.6 hm2,占农用地面积的50.62%。该类农用地面积较大,主要分布在沿海以及松涛水库一带。沿海地区由于降雨量较小、风速较大等气候条件以及养分含量低等条件限制而无法种植;在松涛水库虽然土壤养分充足,但由于其地势较高、坡度较大等条件限制橡胶的种植,且缺少管理,这些都使得松涛水库附近的大片区域不适宜种植橡胶。

(5)由于八一农场在儋州市橡胶生产中占有较大比重,且农场在规划、管理上较为精细,因此以八一农场来检验橡胶适宜性评价结果。根据资料数据[4]计算得到儋州市的橡胶单产为2.5 kg/年·株。结合八一农场的实际情况,将八一农场的橡胶产量进行分等定级,将干胶大于3.0 kg/年·株的地块确定为最适宜种植,适宜种植为2.5~3.0 kg/年·株,次宜种植为2.0~2.5 kg/年·株,小于2.0 kg/年·株的为不适宜种植。将确定好的橡胶产量水平和评价结果进行对应性比较,得到图2。

(6)从图2中不难看出,对应“相同”的区域(17 855.8 hm2)明显多于“不相同”区域(2 454.9 hm2),“相同”区域占验证区域的87.9%。对应性结果表明:图1的评价结果对于八一农场橡胶的种植具有较高的适用性。

3 讨论与结论

(1)种植适宜性评价涉及土地众多性状,即使所选的因子相同,采用不同的评价方法,其评价结果也有所不同。本研究从儋州市出发,以村一级为研究尺度,采用模糊数学的方法,根据橡胶树正常生长对环境条件的相关研究来确定各评价因子的隶属函数的临界值和阈值及散点型函数的隶属度。并运用主成分分析法,对橡胶种植适宜性进行综合评价,并制作了适宜性种植图。通过适宜性评价,因地制宜的发展橡胶树种植产业,从而提高橡胶的产出率,进而创造出最大的经济、生态和社会效益。

此方法在实际应用中仍有一些问题需要注意。首先,数据资料的获取是本方法应用的制约因素,一些重要的评价因子数据将在很大程度上影响评价结果的科学性;其次,评价因子的确定具有一定的局限性,因为评价因子及隶属函数是根据数据资料以及专家意见加以平衡得出的,受影响较大。另外, 在评价过程中获得的基础数据越多、真实性越高, 所得出的评价单元将越零碎。出于评价目的的考虑, 为了更好地为农业管理部门提供决策参考,对于种植适宜性评价结果, 在评价单元(地块)上,还有待进一步的研究。

(2)在今后的研究中,建立、完善一套科学、可行的适宜性评价方法仍有很多工作需要去做。同时,还应加强人员的管理以及肥料的合理使用,以确保橡胶稳产、高产。

参考文献

[1] 许海平,傅国华. 我国天然橡胶产业发展趋势[J]. 中国热带农业,2007,(2):15-16.

[2] 许道顺,许升锋. 经济一体化背景下海南省橡胶产业的发展战略[J]. 海南金融,2006,(9):25-28.

[3] 黄昌勇. 土壤学[M]. 北京:中国农业出版社,2000.

[4] 海南省统计局. 海南统计年鉴2011[M]. 中国统计出版社,2011.

[5] 朱国宇,黄川友,华国春. 层次分析法在水环境规划中的应用[J]. 东北水利水电,2003,21(4):1-7.

[6] 曹志洪,周建民. 中国土壤质量[M]. 北京:科学出版社,2008.

[7] 刘绍贵,张桃林,王兴祥,等. 江西省余江县土壤肥力变化和驱动因素与对策研究[J]. 土壤通报,2006,(10):869-874.

[8] 张 静. 作物-地域多种组合中作物生态适宜性评价与权重配置方法的研究[D]. 南京:南京农业大学,2005.

[9] 华南亚热带作物研究所. 中国橡胶栽培学[M]. 北京:中国科学出版社,1961.

[10] 何 康,黄宗道. 热带北缘橡胶所栽培[M]. 广州:广东科技出版社,1987.

[11] 王秉忠. 橡胶栽培学(第三版)[M]. 华南热带农业大学出版社,2000.

[12] 韦娉婷. 耕地地力评价方法在橡胶园中的应用研究——以海南农垦八一片区为例[D]. 海口:海南大学,2009.

[13] 欧 滨,罗 微,马 利,等. 基于GIS的橡胶园地分等研究[J]. 热带农业科学,2009,29(6):9-14.

[14] 付 强. 数据处理方法及其农业应用[M]. 北京:科学出版社,2006.

[15] 韩永学. 特尔斐法与“拿来主义”[J]. 哈尔滨师专学报,2000(2):67-68.

上一篇:惠阳煤业粉尘自查自纠总结报告下一篇:加强纪检监察干部队伍自身建设方面的调研报告