通讯作者:
收稿日期: 2018-10-22
修回日期: 2018-12-25
网络出版日期: 2019-06-15
版权声明: 2019 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有
基金资助:
作者简介:
作者简介:李宁(1992-),男,河南新乡人,硕士生,研究方向为考古GIS、GIS应用研究。E-mail: 564031955@qq.com
展开
摘要
古遗址作为古人生产、生活的重要场所和文化遗存,客观反映了在长期的人地关系相互作用下的地理空间特征及其分异情况,但是由于史前人类生产力水平低下,在聚落迁移或对周边资源探索中更多地考虑自然环境因素,这种行为符合“最优路径”的思想。本文旨在基于考古调查和基础地理数据,模拟构建古人在聚落选择上的迁移最优路径,探讨古人行为模式,重点研究成本数据确定和成本栅格数据的集成方法及最优路径应用分析。以长江中游新石器晚期的大溪文化、屈家岭文化、石家河文化为连续研究文化期,对其中1200多处遗址的基础地理数据和考古数据进行分析;选取高程、坡度/坡向、地形起伏度、距水系距离等自变量,基于二分类逻辑回归模型,构建研究区史前聚落遗址分布模型。为分析聚落群的时空演变,首先基于期望最大化方法(EM算法)和Voronoi方法对聚落遗址数据进行聚类划分聚落群的中心点的确定,选取分布模型中的自然因子系数作为权重计算成本栅格数据,进而模拟聚落遗址按时序迁移的最优路径。研究结果符合古人类在迁移过程中多考虑以最低成本从山谷、丘陵中穿行的基本规律。并对比已探明的聚落遗址信息,验证模拟的最优路径具有一定的合理性。本文提出的方法,避免了人为选择权重生成成本栅格所带来的仅依靠主观因素的局限,提高了考古研究的科学性,其研究方法和结论对于探究史前聚落遗址时空演变规律和人地关系有一定的参考价值。
关键词:
Abstract
As the relics of the ancients for production and other activities, prehistoric settlement sites reflected objectively the strong geographical features and differentiation patterns of long-term human-environment interactions. Due to the low productivity of the ancients, more natural factors were likely taken into account in between-settlement migration and resource exploration around their residences, which was consistent with the idea of "optimal path." This paper aimed to simulate the optimal path of the ancients in migrating between settlement sites, and to explore their behavioral pattern based on archaeological and geographic data. We emphasized the determination of migration cost, the integration of cost raster layers, and the optimal path analysis. The basic geographical and archaeological data of more than 1200 sites of the sequential cultural period, involving Daxi, Qujialing, and Shijiahe Cultures in the late Neolithic period in the middle reaches of the Yangtze River, were included for this study. Elevation, slope/slope direction, topographical relief, and distance from water were selected as the independent variables to analyze and construct the distribution model of the settlement sites in the study area, based on binary classification logistic regression model. To analyze the spatiotemporal evolution of the settlement groups, firstly, the clustering and centers of the settlement groups were identified based on the Expectation Maximization method and Voronoi algorithm; then, the natural factor coefficients in the distribution model were used as weights to generate the cost raster layers; lastly, the layers were input for simulating the optimal path of between-settlement migration constructed based on the cultural sequence. The results were consistent with the basic rule that the ancients were inclined to walk through valleys and hills in the process of migration at the lowest cost. The simulated path was proved reasonable when compared to the other available site information. The method proposed in this paper can address the limitation of relying on only subjective weighting in generating and integrating the cost raster layers, and can enhance the science of archaeological research. Our method and conclusion help explore the spatiotemporal evolution patterns of prehistoric settlement sites and human-environment relationship.
Keywords:
最优路径是交通运输、人口迁移等交通网络分析中最基本的问题之一,也是地理信息系统(GIS)空间分析的重要功能,目前已广泛应用于城市道路交通、物流交通、通信技术和智慧旅游等领域[1,2,3,4]。史前人类在发展之初由于生产力低下,在聚落迁移过程中对周边资源探索的行为都期望以最小的成本支出获取最大的收益[5],符合“最优路径”的思想。考古学家将最优路径应用到聚落迁移中,期望通过最短路径分析可以找到聚落迁移过程中通达性最好的路线。例如,whitley等[6]对美洲地区史前人口迁移途径的考察,惠夕平[5]对鲁东南地区新石器遗址在不同时期对区域内重要通道利用情况的研究等。在模拟生成最优路径时,成本数据是其最重要的一环,但在目前基本上还没有关于成本数据相关的研究。
与遗址迁移有关的考古遗址分布模型起源于20世纪50年代末的美国新考古学运动(New Archaeology),是迄今GIS在考古中开展的最为主要的研究类型,也是考古研究的一个重要方向,已在世界范围内的考古工作中得到了充分应用。其基本方法是对研究区建立一个定量模型,利用一定的环境变量计算考古遗址的存在概率,通过对模型的解读,认识和推演史前人类与周围环境特征之间的交互关系[7],因此适合被采用来约束“最优路径”中的成本数据问题。目前,遗址分布模型已发展出了多种研究方法,如判别分析(Discriminant Analysis)、分类回归树(Classification and Regression Trees)及逻辑回归(Logistic Regression)等。逻辑回归是一种多元量化的统计学分析方法,通过建立逻辑回归的数学模型,研究分析因变量和自变量之间的关系,借助此模型来分布某种事物发生概率的可能性[8]。逻辑回归没有对自变量分布的假设条件要求,从而避免了分析中面临各种难以满足前提的假设条件,适用范围更为广泛[9]。Kvamme[10]研究表明,二分类变量逻辑回归模型比许多其他统计方法更具有鲁棒性,应用最广泛。
长江中游地区位于中国腹心地带,是中华文明重要的起源地之一,发现了众多灿烂的史前文化遗址,探究此区域内聚落遗址的时空演变规律,对研究史前无文字记载期的环境演变和人地关系有重要科学意义。本文以聚落遗址分布模型中的自然因子系数作为权重计算成本栅格数据,着重减小成本数据中人为选择系数带来的主观误差的问题,使模拟生成的路线更合理,并以长江中游地区新时期晚期聚落遗址数据进行了验证。研究成果对解析古环境演变具有一定的参考价值。
长江中游地区(26°56'N-33°34'N, 108°11'E-116°15'E)地处湖北、湖南两省,西有大巴山、巫山、武陵山、雪峰山屏障,东有桐柏山、大别山、幕阜山环伺。中间为两湖平原(江汉平原和洞庭湖平原),其间河网密布,湖群星罗(图1)。研究区内包括丘陵、平原、山地、河谷等多个地貌类型,为研究提供了空间差异性,利于分析与对比。
在史前文化研究上,考古学家经过多年的野外调查和研究,确定了此区域彭头山文化-城背溪文化-皂市下层-大溪文化-屈家岭文化-石家河文化的新石器考古学文化序列[11]。其相应的考古数据由《中国文物地图集·湖南分册》[12]和《中国文物地图集·湖北分册》[13]中新石器时期文化遗址信息获取,具体的遗址数如表1所示。为保证实验数据的可靠性,选取遗址数量较多,时序连续的大溪文化(距今6300-5300年)、屈家岭文化(距今5500-4600年)、石家河文化(距今4600-4000年)为本文的研究文化期。
表1 长江中游地区新石器遗址文化类型及数量
Tab. 1 Culture types and numbers of the sites in the Neolithic Period in the middle reaches of Yangtze River
| 彭头山文化 | 城背溪文化 | 皂市下层文化 | 大溪文化 | 屈家岭文化 | 石家河文化 | 不详 | |
|---|---|---|---|---|---|---|---|
| 数量/个 | 11 | 8 | 26 | 163 | 250 | 807 | 592 |
由于资料的限制,一般使用现代地理环境研究史前聚落遗址的时空分布特征,虽然会有一定的误差,但这一研究仍十分必要[14]。进入全新世以来,长江中游地区的地形地貌演化受地壳构造运动的影响已经很小,与现今地形地貌接近,仅有宏观框架下幅度较小的变化,表现为区域地理环境在宏观尺度下相对的稳定性,这种稳定性在山地、丘陵地区尤为明显,所以现代地理环境差异仍然能够在一定程度上反映过去环境的特点[15]。这为本文利用现势DEM 数据对史前聚落遗址进行相关分析提供了保障和基础。
研究中使用的基础地理信息数据选取美国国家航空航天局(NASA)2011年10月发布ASTER GDEM(v2)[16],30 m分辨率的DEM数据,作为提取遗址相关自然环境信息(高程、坡度、坡向等)的数据源。同时,由于湖泊河流变动频繁,现有水系与史前水系相比变化较大,而地形地貌相对稳定,利用DEM提取研究区水系网络,能够在一定程度上反演史前水文状况。所有数据统一采用WGS 84坐标后,加载入ArcGIS中进行分析。
考古遗址分布模型能够表现史前人类在迁移路线的“最优路径”问题上着重考虑的遗址与周边自然环境的交互关系,因此适合被采用来约束“最优路径”中的成本数据问题。
本文选取逻辑回归作为建立遗址分布模型的方法,既能够更好地解释遗址与自然环境的关系,又可以生成成本栅格,为后续研究提供数据支持。其回归方程如下:
式中:P为遗址存在的概率;1-P为遗址不存在的概率;自变量
根据式(1)可得P的非线性函数:
依据逻辑回归建立的遗址分布模型,可以有效地将遗址存在的概率P的值域限制在0~1之间。
模型中以是否存在遗址作为因变量,其中存在遗址为1,不存在为0。非遗址点使用ArcGIS中的随机点工具随机生成,假定所有生成的随机点不存在遗址。一般情况下,自然地理方面的成本要素有地形地貌、河流水文等,常用的指标有坡度、坡向、地形起伏度等[5]。结合考古遗址分布模型中常用的指标[17,18],本文选择的自变量见表2。
表2 模型自变量描述及数据来源
Tab. 2 Descriptions and data source of the independent variables of the model
| 遗址属性 | 描述 | 数据来源 |
|---|---|---|
| 高程 坡度 坡向 地形起伏度 | 地形分析重要因子 指示地表的形态起伏和结构特征 受光照的面积 一定区域内地表的平整度 | DEM数据 DEM数据(坡度工具) DEM数据(坡向工具) DEM数据(表面工具) |
| 距水系距离 | 遗址与水源的距离 | DEM数据(水文分析) |
由于各自变量的单位与量纲不同,需要在建模过程之前,对自变量进行归一化处理,即对自变量采用min-max标准化处理,然后转化为栅格数据。
对处理好的实验区数据内大溪文化、屈家岭文化和石家河文化时期的遗址建立二分类逻辑回归模型,采用向后逐步法筛选自变量,使自变量能通过显著性检验,从而最优化遗址模型拟合过程中的方程,结果见表3。
表3 三大文化遗址分布的逻辑回归模型
Tab. 3 Logistic regression models for the distribution of the three cultural sites
| 文化类型 | 自变量 | 回归系数 | 标准差 | Z value | Pr(>|Z|) | 显著性 | |
|---|---|---|---|---|---|---|---|
| 大溪文化 | 常量 | 1.064 | 0.280 | 3.795 | 0.000 | *** | |
| 高程 | -3.672 | 1.846 | -1.990 | 0.047 | ** | ||
| 坡向 | -0.907 | 0.403 | -2.248 | 0.024 | ** | ||
| 坡度 | 3.453 | 1.724 | 2.003 | 0.045 | ** | ||
| 距水系距离 | -1.765 | 0.554 | -3.184 | 0.001 | *** | ||
| 地形起伏度 | -0.602 | 1.575 | -0.382 | 0.025 | ** | ||
| 屈家岭文化 | 常量 | 0.818 | 0.240 | 3.406 | 0.001 | *** | |
| 高程 | -2.321 | 1.531 | -1.516 | 0.130 | |||
| 坡向 | -0.156 | 0.349 | -0.447 | 0.655 | |||
| 坡度 | 0.999 | 1.731 | 0.577 | 0.564 | |||
| 距水系距离 | -0.515 | 0.438 | -1.177 | 0.239 | |||
| 地形起伏度 | -3.831 | 1.715 | -2.234 | 0.025 | ** | ||
| 石家河文化 | 常量 | 0.771 | 0.132 | 5.861 | 4.610e-09 | *** | |
| 高程 | -2.853 | 0.812 | -3.511 | 0.000 | *** | ||
| 坡向 | 0.103 | 0.191 | 0.540 | 0.589 | |||
| 坡度 | 4.408 | 0.852 | 5.174 | 2.290e-07 | *** | ||
| 距水系距离 | -0.776 | 0.263 | -2.956 | 0.003 | *** | ||
| 地形起伏度 | -6.293 | 0.887 | -7.095 | 1.290e-12 | *** | ||
运用5次交叉验证的方法,各时期分布模型遗址点与非遗址点的平均分类正确率分别是大溪文化64.4%、屈家岭文化68.8%、石家河文化67.7%。
为更好地研究聚落迁移路线问题,首先将各时期的聚落遗址聚类为聚落群,再求取聚落群的中心点,以中心点代表聚落群,分析聚落群的时空演变,进而确定演变过程中迁移的“最优路线”。
本文基于期望最大化方法(EM算法)对聚落遗址数据进行聚类划分,并对聚类后的聚落遗址群建立泰森多边形,将遗址群多边形一层层剥落后求得聚落群的中心点,结果如下(图2-图5),其中q10表示q1群(屈家岭遗址群)的中心点,s10表示s1群(石家河文化遗址群)的中心点,d1群(大溪文化遗址群)因有2个中心点,故使用d10-1和d10-2表示,其他聚落群以此类推。
三大文化遗址聚落群的具体分布和演变情况如下:
(1)大溪文化时期聚落遗址共聚类成4个聚落群,以d1-d4表示。聚落群d1位于江汉平原北部与大别山、桐柏山和大洪山交界处;聚落群d2位于洞庭湖西部丘陵地区;聚落群d3位于江汉平原西部;聚落群d4则环绕在洞庭湖的周围。
(2)屈家岭文化时期聚落遗址共划分为6个聚落群,以q1-q6表示。聚落群q1分布在江汉平原东北部与大别山交界处;聚落群q2分布范围较小,分布在聚落群q1西部,与之相接;聚落群q3位于汉水中游的河谷地;聚落群q4、q5分别分布于江汉平原西部和洞庭湖西部的丘陵地区;聚落群q6分布在洞庭湖平原和江汉平原的相接处。
(3)石家河时期聚落遗址共划分为6个聚落群,以s1-s6表示。此时期是新石器时代发展的鼎盛时期,聚落遗址数据剧增,范围比屈家岭时期更加广泛。聚落群s1分布于江汉平原与大别山、幕阜山交界处。聚落群s2分布于江汉平原北部与大别山交界处,相较于屈家岭时期,此处的聚落遗址增加并逐渐向江汉平原腹部深入。聚落群s3分布于汉水中游的河谷两岸。聚落群s4分布于江汉平原西部地区,较屈家岭时期聚落群范围略有收缩。聚落群s5和s6分别位于洞庭湖周边东西侧。
聚落群的演变是聚落群中迁移路径生成的 前提,本文利用ArcGIS软件中的距离分析工具,基于栅格数据生成最优路径,其基本步骤如下:
(1)成本数据的准备。在确定生成最优路径之前,首先要根据研究区域的实际情况确定影响成本的因素。通常情况下,影响成本因素有地形、地貌和河流等。常用的因素指标有高程、坡度、曲率、地形起伏度和距水系距离等。
(2)成本栅格数据的集成。在确定好影响成本数据的指标后,首先对各指标栅格数据进行重采样,使用的是栅格数据处理工具的重采样技术;然后对重采样过后的栅格数据使用栅格计算器,以遗址分布模型的系数赋予各指标栅格数据权重并合并成成本栅格数据。
(3)最优路径的生成。利用上一步生成的成本栅格数据,执行距离分析工具中成本距离和成本路径生成最优路径。
按照上述流程,本研究将3个时期的聚落遗址聚群分析后,选取典型聚落群中心遗址,顾及聚落中心点相离的距离、地形、地貌等因素,共生成了大溪时期的d1群到屈家岭时期q2、q3群、d3群到q3群3条路径(图6)和屈家岭时期q1群到石家河时期的s1群、s3群的2条路径(图7)。其他聚落群中的路径因涉及到洞庭湖水域,环境条件会更加复杂,因此本文暂时选取研究区上半部的聚落群间生成路径。
图6 大溪-屈家岭时期部分聚落群最优路径
Fig. 6 Optimal migration paths for partial settlement groups in the Daxi-Qujialing period
图7 屈家岭-石家河时期部分聚落群最优路径
Fig. 7 Optimal migration paths for partial settlement groups in the Qujialing-Shijiahe period
研究表明,史前人类在迁移过程中多考虑从山谷、丘陵中穿行,以此达到以最低成本获取更高收益的目的[5]。本文生成的迁移路线与此研究结果相符合,生成的路线在荆山、大洪山、桐柏山、大别山的山谷和丘陵地带。在图6和图7中,结合已经探明的已有聚落遗址信息,模拟出来的最优路径周边存在一定量的聚落遗址,也说明此路径具有一定的合理性。
(1)大溪文化时期处于全新世大暖期的鼎 盛期,期间气候温暖,人类聚落遗址迅速增加。位于江汉平原西部地区的聚落群(d3群)也迅速向外扩张,但是由于此时江汉平原大部分地区还是湖 群遍地的云梦泽地区,湖水泛滥不适合人类居住,而汉水中游地区以其优越的地理环境吸引人类去定居,故从江汉平原西部地区的d3聚落群沿着d30-q30路线到达汉水中游地区。同样,d1聚落群到q3聚落群的迁移路径同样是沿着汉水的d10-q30路线。
(2)位于汉水以东、大别山以西、长江以北、大洪山以南的丘陵岗地(q2聚落群),多为平坦的岗地平原地貌,又有众多小河流穿插其间,加之当时高温多雨的气候为此地区的农业生产提供了充足的条件,具备了人类生存的地理条件,故聚落群d1沿着大洪山与江汉平原交界处的d10-q20路线向聚落群q2迁移。
(3)屈家岭时期,由于优越的地理及生态条件,此地聚集了q1、q2两个聚落群,q2聚落群迅速发展,遗址数量增多,密度增大,聚落群范围不断向外扩张。在东部挤压q1聚落群,使得q1聚落群沿着q10-s10的路线向东南方向移动,逐渐演变为石家河时期的s1聚落群;西部则在大别山、桐柏山和大洪山的山谷地带沿着q10-s30路线向汉水中游地区扩张,最后发展成为石家河时期的s2聚落群。
本文以长江中游地区新石器晚期聚落遗址为研究对象,通过对遗址建立分布模型,在分布模型系数的约束下生成成本栅格数据,最终模拟生成聚落迁移的最优路径,得出以下结论:
(1)由遗址分布模型可知,不同时期遗址选址侧重点不同。大溪文化时遗址分布与高程、坡向、距水系距离、地形起伏度呈负相关,与坡度呈正相关。大溪文化处于大暖期的鼎盛期,此时的自然条件非常利于人类发展,选址更加关注低高程、近水系但又有一定坡度的地区。相比之下,屈家岭文化遗址模型中高程系数、距水系距离系数和坡度系数减小,地形起伏度系数增大。在大溪文化晚期、屈家岭文化早期,此时的气候有一次降温事件发生,降温带来气候的反常,使得降水多寡不均,水旱灾害频繁,洪水位升高,湖群扩张,这都可能严重影响到稻作农业的发展。此时期的人类为了适应气温下降,居住地选择在高程因素上有所降低,洪水泛滥、湖群扩张使得居住地离水源更近,坡度减小与地形起伏度增加说明居住地关注更加平坦地区。在石家河时期,气候转向温凉,降水减少,湖群萎缩,此时期是新石器时期的鼎盛时期,人类活动逐步由丘陵地带向湖区平原和山地地区推进,遗址分布模型表现在,相比于屈家岭时期,高程、坡度、地形起伏因素增大。
(2)本文以遗址分布模型约束成本数据,在此成本数据下生成的迁移路线在荆山、大洪山、桐柏山、大别山的山谷和丘陵地带,符合史前人类在迁移过程中多考虑从山谷、丘陵中穿行,以此达到以最低成本获取更高收益的目的[5]。需要指出的是,本文生成最优路径的目的是为了模拟各时期聚落遗址群演化过程中聚落迁移路线,其最优路径并不等于实际中的聚落群之间的迁移路线。本研究是生成成本数据方法的探讨,在成本数据的地理因素选择、遗址分布模型的算法上还有待改进。而通过模拟的最优路径与已有聚落遗址的空间分布关系(图6和图7),说明此路径具有一定的合理性。
The authors have declared that no competing interests exist.
| [1] |
基于GIS与约束条件下的最优路径规划研究 [J].Research on optimal path planning with constraints based on GIS [J]. |
| [2] |
基于GIS的现代物流管理系统设计与实现 [J].Design and realization of modern logistics management system based on GIS [J]. |
| [3] |
基于GIS的电力物资公司物流配送路径优化研究 [D].Research on optimization of logistics distribution path of the power supplies [D]. |
| [4] |
最短路径分析在旅游信息系统中的应用 [J].Application of the shortest path analysis in tourism information system [J]. |
| [5] |
地理信息系统支持下的鲁东南沿海地区史前至汉代聚落考古研究 [D].A study on the settlement archaeology in the coastal area of southeastern Shandong, China from prehistoric period to Han Dynasty supported by GIS [D]. |
| [6] |
A geographic information systems approach to understanding potential prehistoric and historic travel corridors [J]. |
| [7] |
山东沭河上游流域考古遗址预测模型 [J].https://doi.org/10.11820/dlkxjz.2009.04.002 Magsci [本文引用: 1] 摘要
<p>以山东莒县沭河上游流域地区为研究案例,通过对大汶口、龙山和岳石文化时期遗址空间结构及其与环境特征的关系分析,建立了基于GIS的沭河上游考古遗址预测逻辑斯蒂回归模型,较为精确地分析得出遗址分布与地形高度、河流分布等因子间的定量关系。研究结果表明,山东莒县沭河上游流域地区遗址点分布在高程较低和坡度低于3°的地方,说明遗址点多选择在较为适宜农业活动的地方;在遗址选择朝向上,整个研究区域的朝向分布比较均衡,但以西、西南、东和东南为主;史前人类的居住地主要沿支流分布,而远离干流,以避免洪水灾害的危害;随着时间的推进,遗址点所处位置的高程和坡度逐渐增高增大,距离河流的各种距离总体上也呈增加的趋势,这与人类克服环境限制能力的提高有关系。</p>
Predictive model of archaeological sites in the upper reaches of Shuhe River in Shandong [J].https://doi.org/10.11820/dlkxjz.2009.04.002 Magsci [本文引用: 1] 摘要
<p>以山东莒县沭河上游流域地区为研究案例,通过对大汶口、龙山和岳石文化时期遗址空间结构及其与环境特征的关系分析,建立了基于GIS的沭河上游考古遗址预测逻辑斯蒂回归模型,较为精确地分析得出遗址分布与地形高度、河流分布等因子间的定量关系。研究结果表明,山东莒县沭河上游流域地区遗址点分布在高程较低和坡度低于3°的地方,说明遗址点多选择在较为适宜农业活动的地方;在遗址选择朝向上,整个研究区域的朝向分布比较均衡,但以西、西南、东和东南为主;史前人类的居住地主要沿支流分布,而远离干流,以避免洪水灾害的危害;随着时间的推进,遗址点所处位置的高程和坡度逐渐增高增大,距离河流的各种距离总体上也呈增加的趋势,这与人类克服环境限制能力的提高有关系。</p>
|
| [8] |
基于空间相关的逻辑回归模型的城市扩展模拟 [J].Simulation of urban expansion based on logistic regression with the consideration of spatial correlation [J]. |
| [9] |
基于逻辑回归模型的雷电潜势预报方法 [J].The method of lightning potential prediction based on logistic regression model [J]. |
| [10] |
The fundamental principles and practice of predictive archaeological modeling [J]. |
| [11] |
|
| [12] |
|
| [13] |
|
| [14] |
中原地区数字环境考古研究 [D].Archaeological Study of Digital Environment in Central Plains [D]. |
| [15] |
长江中游新石器时代文化与生态环境关系研究 [D].The relationship between Neolithic culture and ecological environment in the middle reaches of the Yangtze River [D]. |
| [16] |
|
| [17] |
郑洛地区龙山文化遗址预测模型 [J].Predictive model of archaeological sites of Longshan Culture in Zhengzhou-Luoyang area [J]. |
| [18] |
采用逻辑回归的汾河流域遗址分布研究 [J].Study of distribution characteristics of archaeological sites in Fenhe River basin based on logistic regression [J]. |
/
| 〈 |
|
〉 |