数据处理工具-回归与地理加权回归
工具简介
为了挖掘或量化要素间关系,我们常常使用回归分析。回归分析可评估两个或更多要素属性之间的关系,对空间关系进行建模、检查和探究,还可用于解释所观测到的空间模式背后的诸多因素,即可以更好地了解某地正在发生的事情、预测某地可能发生某事或者着手调查事情发生在事发地的原因。
位和平台回归分析工具有两种回归计算方法,一种为常用的普通线性回归,线性回归能提供一个全局模型,对空间中整体的因变量与解释变量的关系进行解释,创建一个回归方程来表示变量之间的联系。另一种方法为地理加权回归,地理空间要素间常常具有空间自相关,因此传统的线性回归结果变得不可靠,地理加权回归为数据集中的各要素构建了局部回归方程。
①选择回归计算方式
选择计算类型:可根据实际需要选择适当的回归计算方式。 普通线性回归研究解释变量与因变量之间的关系在空间上的整体规律,地理加权回归则考虑空间中解释变量与因变量之间的关系随地理位置发生变化的情况。
②选择空间文件
选择回归文件:在下拉框下拉选择需要进行回归计算的空间文件,可以是点文件或者面文件。
②选择因变量
选择因变量:选择包含因变量值的字段,即所要研究的对象。因变量只能输入一个。
③选择解释变量
选择解释变量:选择包含解释变量值的字段,解释变量一般是所要研究对象的影响因素或驱动因素,解释变量可以设置多个。
④设置输出文件名称,提交运行
设置输出文件名称:给输出的文件命名,若不设置名称,将自动命名为“工具名称_计算类型_提交运行时间”。
完成设置后,点击“提交运行”启动工具。
运行成功后页面上方将会提示完成计算!数据已上传到“我的数据”,可点击打开数据按钮开始访问数据或到数据页面查看启动。
如对五大湾区经济指标的回归分析结果,设置因变量为地区生产总值,根据经济增长模型,劳动力与资本是影响地区生产总值的基本变量,可以用人口和固定资产投资表征,因此设置年末总人口数及固定资产投资总额为因变量,分别进行了普通线性回归及地理加权回归计算,得到如下所示结果。
下图分别为普通线性回归及地理加权回归的标准化残差分布,标准化残差可用来衡量回归估计的可靠性,一般在2.5倍标准差内的结果都认为可以接受。
如下图为普通线性回归所得参数,普通线性回归只考虑因变量与解释变量之间整体的关系,只得到一组参数,包括截距、两个解释变量的回归系数以及线性回归决定系数R2。
地理加权回归会得到随空间变化的不同的参数值。
下图为地理加权回归的局部R2在空间上的分布,局部R2与全局R2意义相同,表示局部回归模型估计与观测值的拟合程度。可以发现,环渤海湾区及粤港澳湾区局部R2较高,说明这些地区回归估计结果的解释度更高。
下图为各回归系数在空间上的分布,地理加权回归会给出各位置每个解释变量的系数。可以看出人口的回归系数与地区生产总值呈正相关关系,劳动人口的多少对经济的发展具有正向促进作用。其中在南方劳动人口对经济发展的影响较北方更为明显。
固定资产的投资对经济总量的影响也为正相关关系,其影响程度由在粤港澳湾区最大。