机器学习模型利用机器学习与数据挖掘方法,提取土壤属性与环境变量之间的关系用来预测土壤属性的空间分布,可以解决土壤属性与环境变量的非线性问题,包括随机森林人工神经网络分类与回归树等。目前随机森林法进行属性制图在数据挖掘方法中应用广泛。
模糊推理是将土壤与环境关系表达为隶属度值,利用单个土壤样点在空间上的代表性推测土壤目标变量的空间变化。该方法制图效果依赖于单个样点的**性,要求对样点的**性进行质量检查。上述方法有两个制约需要大量的土壤样点来提取统计关系;需要具有较好的空间代表性,除机器学习模型外,其它模型制图区域通常不宜过大。
尽管地统计学方法被证明是一种易操作且结果较为**的数字土壤制图的方法,土壤调查,但其要求数据满足地统计学相关假设,给实际应用带来一定困难。此外,插值过程需要利用预测变量的空间自相关性,而地学现象的复杂性和性使得一个地区的模型很难直接应用到其他地区。
机器学习模型利用机器学习与数据挖掘方法,提取土壤属性与环境变量之间的关系用来预测土壤属性的空间分布。与前两种方法相比,机器学习模型可以解决土壤属性与环境变量的非线性问题,且对数据分布没有要求,因此被越来越多地应用于数字制图领域。常用的机器学习模型包括人工神经网络(Artificialneuralnetworks,ANN)分类与回归树(Classificationandregressiontree,CART)随机森林(Randomforest,RF)等。2机器学习模型
土壤属性多为数值,在空间上是连续的,土壤调查数据汇交,并线截然分开。采用数字土壤模型制图方法进行土壤属性制图,输出结果为数值型的栅格地图。每个栅格像素为一个土壤属性值,像素之间不存在接边问题。但由于不同地貌区域终采用的适宜模型可能不同,特别是在本区域制图而在区外无样点时,对区界处的预测属性值度会降低,可能会造成两区相邻处像素属性值出现相差较大的情况。为避免减少此类情况,土壤调查外业调查采样调查第三方,模型制图时,需增加域外样点,土壤调查外业调查采样公司,即区域制图时,将与本区相邻地区的区界样点补充进训练集进行模型制图,然后以区界裁切获得本区成果图。3土壤属性制图相邻区处理