360网站安全检测平台

扫一扫,关注我们

首页>学术科研>研究报告>基于腾讯迁徙数据的泛珠三角春运期间人口流动网络的结构不均衡性研究

基于腾讯迁徙数据的泛珠三角春运期间人口流动网络的结构不均衡性研究

发布时间:2024-04-17来源:国土空间创新所作者:李仁杰

基于位置服务的人口迁徙数据能够直观、动态和详尽地描绘城乡居民日常活动的行为轨迹和时空特征。本文采用腾讯迁徙数据,通过时空统计和复杂网络方法分析泛珠三角地区人口流动的时空格局和结构特征。结果显示,泛珠三角地区人口日常流动的时空分异和层级鸿沟特征明显,春运期间总体呈现“S”型反向交互模式,各城市度中心性与所属层级高度耦合,时段演变趋势具有差分空间正相关关系,Ⅰ型、Ⅱ型城市度中心性及其波动幅度显著高于Ⅲ型、Ⅳ型;迁徙路线方面,省内流动呈现以省会城市为首、周边城市为辅的放射状结构,跨省流动主要表现为以珠三角地区为核心的扇形结构,同时伴有“两横两纵”4条高密度的迁徙走廊;结构均衡方面,Ⅰ型、Ⅱ型城市结构不均衡度较高,凭借强势的虹吸效应形成城市发展的外生驱动力,Ⅲ型、Ⅳ型城市结构不均衡度较低,与周边城市的共生性、对省会城市的依赖性较强,城市发展处于被极化的边缘位置。

摘要

基于位置服务的人口迁徙数据能够直观、动态和详尽地描绘城乡居民日常活动的行为轨迹和时空特征。本文采用腾讯迁徙数据,通过时空统计和复杂网络方法分析泛珠三角地区人口流动的时空格局和结构特征。结果显示,泛珠三角地区人口日常流动的时空分异和层级鸿沟特征明显,春运期间总体呈现“S”型反向交互模式,各城市度中心性与所属层级高度耦合,时段演变趋势具有差分空间正相关关系,Ⅰ型、Ⅱ型城市度中心性及其波动幅度显著高于Ⅲ型、Ⅳ型;迁徙路线方面,省内流动呈现以省会城市为首、周边城市为辅的放射状结构,跨省流动主要表现为以珠三角地区为核心的扇形结构,同时伴有“两横两纵”4条高密度的迁徙走廊;结构均衡方面,Ⅰ型、Ⅱ型城市结构不均衡度较高,凭借强势的虹吸效应形成城市发展的外生驱动力,Ⅲ型、Ⅳ型城市结构不均衡度较低,与周边城市的共生性、对省会城市的依赖性较强,城市发展处于被极化的边缘位置。


关键词:腾讯迁徙数据;泛珠三角地区;春运;人口流动网络;结构不均衡



引言


人口流动是指人群在区域间移动以满足某种功能需要的时空过程,其作为要素空间再配置的特殊形式,无论对流出地或者流入地而言,均有推动经济社会发展的重要作用[1]。进入21世纪以来,伴随我国城镇化进程加速、城乡户籍体制改革和交通基础设施的完善,人地依存关系逐渐开始瓦解,经济发展水平差异刺激了区域人口流动的数量和频率迅速拔高。根据《2018年国民经济和社会发展统计公报》统计[2],我国流动人口数量高达2.41亿人,约占全国总人口的17.3%,日渐呈现出规模化、日常化和多元化的特征。因此,人口流动成为非常值得探讨的话题。


人口流动作为跨学科的交叉领域,早期研究主要关注对人口流动机制的解释,国外学者分别从人口学[3]、运动学[4]、行为学[5]、经济学[6]、社会学[7]等方面进行研究,从而为后续研究奠定了理论基础。传统的人口流动研究范式多以宏观的全国人口普查、统计年鉴和1%人口抽样调查结合微观的调查问卷作为核心方法,研究内容涉及人口流动时空格局与驱动机制[8-9]、流动人口的空间集聚和社会融合[10-11];人口流动的外部性影响[12-13]等内容。近年来,伴随智能设备的普及和数据挖掘技术的成熟,移动位置大数据开始广泛应用于人口流动的相关研究[14]。其中,一类主要通过构建人口流动关系矩阵,基于GIS分析和时空统计等方法,刻画多尺度人口流动时空格局、集散过程以及驱动机制,揭示人口流动的区域指向性、时序对称性和空间集聚性[15-18];另一类主要是借鉴图论与复杂网络测度方法,从中心性、联系强度、社区结构等多角度刻画人口流动网络的结构特征[19-23]。以上两类较为成熟的地理流空间分析模式[24],对于探究区域人口流动的规律及其映射的经济社会问题具有重要的科学创新意义,尽管其是否属于新的科学研究范式仍然有待进一步讨论[25]。


流空间的兴起与发展彻底颠覆了欧几里得空间建构的传统认知,地理要素的空间流动导致区域城市体系逐渐呈现出扁平化、网络化和去中心化的特征[26]。网络的关键在于“络”,即网络节点间的联系。城市节点受到网络优先连接趋势的影响,存在极化效应和网络不平衡现象[23],导致区域城际关系的不对等或是网络结构的失衡。但就目前而言,关于人口流动网络结构不均衡特征的相关研究较为薄弱,已有研究侧重分析人口流动的空间集聚和结构联系特征,对于人口流动网络的城际交互关系和微观层面的城市稳定结构关注度不足,忽略了跨层级的城际人口流动对于网络本身的反身性影响。春运是全球规模最大、频率最高、具有明显周期性的人口迁徙运动,而泛珠三角地区城市层级分异特征明显,中西部省份发展水平较低且劳动资源丰富,既是珠三角地区主要的经济腹地和辐射范围,亦是东部沿海省份人口输入的主要来源地,人口流动密度高度集中,因而具有典型性。本研究基于腾讯迁徙数据构建了泛珠三角地区人口流动网络,以跨层级的城际人口互动关系作为基础,创新性地引入社会结构理论结合复杂网络方法,从人口流动的时空格局以及中心度、联系强度和结构不均衡度等微观角度探究网络结构的不均衡特征,其结果既有助于探究区域经济发展的差序格局,挖掘其潜在的经济社会问题,更好地发挥珠三角地区对西南地区的辐射带动作用,亦可给其他相关的研究提供经验,为推动区域的均衡发展与交通设施的建设完善提供科学参考。


01

数据来源与研究方法


1.1

数据来源


本文研究数据来源于腾讯位置大数据平台(https://heat.qq.com/)下基于位置服务(location based service, LBS)的人口迁徙轨迹数据,获取方法是访问腾讯位置大数据官方网站,选择泛珠三角地区“九省二区”共计120个城市的人口迁徙记录,通过抓取后台城际迁徙的人次数据,按照春运的官方定义,采样时间设为2018年2月1日至3月12日(共计40d),获取数据近9.6万条,基于度分布幂律检验与曲线拟合,发现该数据具有无标度和小世界特征,适用于复杂网络分析。需要说明的是,在综合考虑各方面因素后,本文在研究和分析过程中剔除了三沙市和其他的县级市,保留少数民族自治州和港澳特别行政区。


1.2

研究方法


1.2.1 K-均值聚类方法


K-均值聚类方法是广泛应用于数据挖掘领域的分割聚类算法,其运算逻辑是随机选择K个数据对象作为原始类簇中心,分别计算所有数据对象与类簇中心的欧式距离,并将其划分至最邻近的类簇中心内从而形成K个类别,再重新计算划分后新的簇类中心,重复迭代运算直至误差准则函数收敛为止,其缺陷是必须先验性地人为确定类别个数[26]。因此,本文结合数据挖掘工具Weka(Waikato Environment for Knowledge Analysis)的X-均值聚类方法确定类别数量,再通过统计软件SPSS进行K-均值聚类计算得出分类结果[27-28]。


1.2.2 差分空间自相关


空间自相关方法通常用以分析数据同一属性的空间相关性,通过构建空间权重矩阵计算不同地理实体的相关系数,基于Moran’s I、Z-Score和P-Value这3个指数用以分析地理实体是否存在集聚、离散和随机等空间分布模式。差分空间自相关方法与之类似,其主要用以分析数据同一属性的时序变化是否存在空间相关关系,表征该属性的阶段变化态势是否具有空间趋同性,从而识别变化趋势相似的地理实体空间集聚区域,本文通过空间分析软件Geodata完成差分空间自相关的计算过程。


1.2.3 复杂网络测度


(1)度中心性

复杂网络通常以中心性衡量某个节点在网络中的重要程度,表征该节点对整个网络的辐射和控制作用,常用的度量方法包括度中心性(degree centrality)、中介中心性(betweenness centrality)、邻近中心性(closeness centrality)、特征向量中心性(eigenvector centrality)和网页排名中心性(pagerank centrality)。其中,本文采用的度中心性是刻画网络节点中心性最直接和常用的度量指标,其计算公式[29]为:

式一

式一中:DCᵢ为节点i的度中心性,数值越大该节点越重要;aᵢⱼ为节点i与j的连接数量;n为节点数量。度中心性旨在求节点i与剩余节点连接数量和。


(2)联系强度

城际间出于维持正常的生产生活功能通常存在大量的物质、能量、资金和信息等要素的交换和联系,所形成的城际空间交互作用和城市节点共同构成城市网络。点和线是网络中最重要的组成部分,点构成网络的基本单位,线代表节点间的联系构成“络”,但不同节点、不同联系存在层级强度差异。因此,复杂网络中通常采用联系强度来衡量两两节点之间联系的紧密程度,其计算公式[30]为:


式二

式二中:CSᵢⱼ表示城市i与j之间的人流强度,数值越大说明在T时段彼此联系愈加紧密;Pᵢⱼ和Pⱼᵢ是城市i与j间双向人流量;Td代表T时段所包含的天数。


(3)结构不均衡度

结构不均衡度概念源于社会均衡理论,意指人际网络中的局部关系可能会影响整体结构的稳定性,仅当节点间形成共性的三角稳定关系时才可达到结构均衡[31]。人口流动网络中跨层级的城际流动过程中,势必存在一方主导和另一方被主导的格局,由此可判断两两间的关系不均衡甚至可能是核心—边缘式的对立关系。因此,本文将该理论引入复杂网络中,提出网络结构不均衡度的概念,通过计算表征网络集聚特征的聚类系数[32]和表征彼此连接关系的结构均衡比,两者相乘得到各城市的结构不均衡度,其计算公式为:

式三

式三中:SIᵢ为结构不均衡度;N'为跨层级节点连接数量;N''为同层级节点连接数量;kᵢ为与第i个节点直接连接的节点数量;Mᵢ为kᵢ个节点间实际连接边数。


02

人口日常流动时空特征


城市人口流动存在流入和流出两种状态,两者净差值称为净流量。净流量大于零表明该城市在特定时间内人口流入高于流出,城市总人口持续增加,从而将其定义为人口集聚,相反则为人口消散。本文以城市作为基本单元,分类汇总各城市逐日净流量与累积净流量,以此绘制时空变化趋势图(图1),可知泛珠三角地区春运期间的人口日常流动存在时序层面的不均衡性,体现为以年初二而非除夕作为分割线,节前的返乡潮和节后的返工潮呈现反向对称模式,元宵节后的返学潮形成人口流动次高峰。因此,本研究将2018年2月1日(腊月十六,春运开始)至2月17日(正月初二)、2月18日(正月初三)至3月2日(正月十五)、3月3日(正月十六)至3月12日(正月廿五,春运结束)分别定义为返乡期、返工期以及返学期3个阶段。

图1 泛珠三角地区人口流动逐日净流量时空变化


泛珠三角地区春运期间人口流动的时空分异规律总体可归纳为:


(1)春运起始日各城市净流量就已偏离横轴,与前文所述人口流动常态化的论述相符,少部分大城市人流开始消散,广泛的中小城市人口开始集聚,表明春运正式开始前返乡人潮就已出现。春运开启后人流的集散层级迅速拔高,广州、深圳、成都、长沙、南昌和厦门等核心城市人口急剧消散,茂名、衡阳、怀化和黔东南等中小城市人口缓慢集聚,此时消散的规模高于集聚的规模,层级鸿沟明显,城际关系失衡。


(2)逐日净流量时空变化以年初二作为时间节点,返乡期和返工期呈现人口集散状态的“S”型反向对称模式,区域核心城市变化趋势较陡而边缘城市则趋于平缓。返乡期各城市累积净流量变化呈现出核心城市总人口骤降而边缘城市总人口缓升的趋势,春节期间变化平缓,各城市总人口趋于饱和稳定,返工期核心城市总人口上升、边缘城市下降,前后呈现“U”型演变模式。


(3)返乡期人流集散高峰介于腊月廿四至廿九,集聚最高峰值于廿五茂名(338751人次)出现,消散最高峰值于廿四深圳(-359827人次)出现,集散状态持续到年初二;返工期的人流集散高峰介于正月初六至初八,集聚最高峰值于初七深圳(568656人次)出现,消散最高峰值于初八衡阳(-306917人次)出现,返工高峰一直持续到年初十。


(4)返学期受到大批在校大学生返校的影响,形成节后的返程人流次高峰。人流集散高峰多集中在正月十六出现,集聚峰值于正月十六南昌(436605人次)出现,消散峰值于正月二十贵阳(-297807人次)。无论是集散峰值或持续时间,返学期显著低于返乡期和返工期,集散高峰过后人口集散层级回归平稳水平。部分城市春运期间累积净流量均为正值或负值,春节前后人口流入流出不对等。


综上所述,泛珠三角地区春运期间的人口流动具有空间集聚性和时序差异特征。特定时期内的人口流动集聚和消散状态的交替变换构建而成的时间变化序列,能够较好地反映该地区人群出行需求潜在的变化特征[27]。因此,通过泛珠三角地区春运期间逐日净流量的变化序列构建人流集散序列,首先基于数据挖掘工具Weka进行X-均值聚类确定类别数量,再通过统计软件SPSS的K-均值聚类方法,将泛珠三角地区春运期间所有城市的逐日净流量时间序列作为因变量进行时空聚类,对所有城市进行层级划分(表1)。


表1 基于日常净流量时序变化的泛珠三角地区城市层级聚类结果