Content uploaded by Faming Huang
Author content
All content in this area was uploaded by Faming Huang on Dec 05, 2023
Content may be subject to copyright.
地球 科学 Earth Science
http://www.earth‐science.net
第 48 卷 第5期
2 0 2 3 年 5 月
Vol. 48 No. 5
May 2 0 2 3
https://doi.org/10.3799/dqkx.2022.247
基于自筛选深度学习的滑坡易发性
预测建模及其可解释性
黄发明1,陈 彬 1,毛达雄 2,刘乐开 1,张子 荷 1,朱 莉 1*
1. 南昌大学信息工程学院,江西南昌 330031
2. 南 昌大 学工 程建 设学 院,江 西南 昌 330031
摘 要: 针 对 滑 坡 易 发 性 预 测 建 模 中 滑 坡 -非滑坡样本可能存在误差、环境因子间非线性关系较复杂且机器学习可解
释 性 未 被 关 注 等 重 要 问 题 ,拟 提 出 一 种 基 于 自 筛 选 的 双 向 长 短 时 记 忆 网 络 与 条 件 随 机 场 的 滑 坡 易 发 性 预 测 模 型(Self-
screening Bi-directional Long Short-Term Memory and Conditional Random Fields, SBiLSTM-CRF).SBiLSTM-CRF 模型具
有 深 度 学 习 网 络 层 数 深 、宽 度 广 及 可 循 环 迭 代 建 模 的 优 势 ,能 预 测 出 环 境 因 子 间 的 非 线 性 关 系 ,并 通 过 迭 代 自 动 筛 选
阈值区间外的错误滑坡样本 .该模型可用于解释各环境因子之间耦合关系的内部作用机制 .将SBiLSTM-CRF 模型用
于陕西延长县滑坡易发性预测,并与cpLSTM-CRF、随 机 森 林 、支 持 向 量 机 、随 机 梯 度 下 降 和 逻 辑 回 归 模 型 比 较 .结 果
表 明 ,SBiLSTM-CRF 克服了传统机器学习中存在的样本误差以及因子间复杂的非线性关系问题,具有更高的预测性
能.通过该模型的可解释性能力揭示了坡度、高程和岩性等因子控制延长县的黄土滑坡发育的机制.
关键 词: 滑 坡易发性预测;深度学习;双向长短时记忆网络;条件随机场;可解释 性;工程地质 .
中图分类号:P64 文章编号:1000- 2383(2023)05-1696-15 收稿日期:2022-08-18
Landslide Susceptibility Prediction Modeling and
Interpretability Based on Self-Screening Deep Learning Model
Huang Faming1, Chen Bin1, Mao Daxiong2, Liu Lekai1, Zhang Zihe1, Zhu Li1*
1. School of Information Engineering, Nanchang University, Nanchang 330031, China
2. School of Infrastructure Engineering, Nanchang University, Nanchang 330031, China
Abstract: To address the problems of landslide susceptibility prediction (LSP) modeling including possible errors in landslide and
non-landslide samples, complex non-linear relationships between environmental factors and unaddressed machine learning
interpretability, a deep learning-based Self-screening Bi-directional Long Short-Term Memory and Conditional Random Fields
(SBiLST M-CRF) model is proposed to reduce the impact of these problems on LSP and improve its confidence. The SBiLSTM -
CRF model has the advantages of deep learning network with deep layers, wide width and iterative modeling, which can predict
the non-linear relationship between environmental factors and automatically screen out the wrong landslide samples; it can select
non-landslide samples from the initial low/very low landslide susceptibility zone through iterative modeling, and finally reveal the
基金 项目 :国家 自然 科学 青年基金项 目(No.41807285).
作者 简介 :黄 发 明( 1988 — ),男 ,博 士 ,副 教 授 ,研 究 方 向 为 地 质 灾 害 风 险 评 价 . ORCID :0000‐0002‐4428‐7133. E ‐mail :
faminghuang@ncu. edu. cn
* 通 讯作者:朱 莉,E ‐mail: lizhu@ ncu. edu. cn
引用格 式:黄发 明,陈彬 ,毛 达雄 ,刘 乐开 ,张 子荷,朱莉 ,20 23. 基于自筛选深度学习的滑坡易发性预测建模及其可解释性 .地球科学,48(5):
1696-1710.
Citation:Huang Faming,Chen Bin,Mao Daxiong,Liu Lekai,Zhang Zihe,Zhu Li,2023.Landslide Susceptibility Prediction M odeling and Interpret‐
ability Based on Self‐Screening Deep Learning Model.Earth Science,48(5):1696-1710.
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
internal mechanism of the coupling of environmental factors to predict landslide susceptibility. The SBiLSTM-CRF model is used
to predict landslide susceptibility in Yanchang County of China, and compared with cpLSTM-CRF, random forest (RF), support
vector machine (SVM), stochastic gradient descent (SGD) and logistic regression (LR) models. The results show that SBiLSTM-
CRF overcomes the problems of sample error and complex nonlinear relationship between factors in traditional machine learning ,
has superior performance in modeling susceptibility than conventional machine learning, and the interpretability of the model
reveals that factors such as slope, elevation and lithology control the development of mounded landslides in Yanchang County.
Key words: landslide susceptibility prediction; deep learning; Bi‐directional long short‐ term memory; conditional random field;
interpretability analysis; engineering geology.
0 引言
滑 坡 灾 害 具 有 分 布 广 、发 生 频 率 高 、灾 害 损
失 严 重 等 特 点 ,滑 坡 严 重 威 胁 人 类 生 命 财 产 安 全
(Khan et al., 2021).滑坡易发性预测对滑坡风险
评价和潜在滑坡的准确定位具有重要作用 .
近 几 十 年 来 ,各 种 基 于 GIS 平台的方法被用
于 预 测 滑 坡 易 发 性 ,包 括 启 发 式 模 型(Moragues
et al., 2020),数理统计模型如判别分析(Eiras et
al., 2021)、多元线性回归(Jia et al., 2021)、确 定
性 系 数 等(罗 路 广 等 ,2021).由 于 上 述 模 型 并 不
能较好地揭示出易发性建模中各环境因子之间
的 非 线 性 作 用 关 系 ,并 且 通 常 需 要 大 量 先 验 知
识 ,导 致 这 些 模 型 存 在 一 定 的 局 限 性 .近 年 来 ,机
器学习由于其不需要过多的先验知识(如不需要
环 境 因 子 呈 正 态 分 布),且 能 获 得 较 高 预 测 精 度
而被广泛应用于滑坡易发性预测,如人工神经网
络(田 乃 满 等 ,2020)、支持向量机 (Support Vec‐
tor Machine , SVM)(Yao et al., 2008)、决 策 树
(Pradhan , 2013)、随 机 森 林 (Random Forest,
RF)( 吴 润 泽 等 ,2021)、多 层 感 知 机(Huang et
al., 2020a)、逻 辑 回 归 (Logistic Regression, LR)
(方 然 可 等 ,2021)、随机梯度下降(Stochastic Gra‐
dient Descent , SGD)(Hong et al., 2020)等 .
然而,传 统的机 器 学习应用 于滑坡易 发性预测
还存在许多问题:(1)表征学习需要大量的先验知
识和假 设 空间,且不能充 分地提取 出各环境 因子之
间的非线性关系(Huang et al., 2020b);(2)不 能 较
好地实现滑坡样本中的误差剔除,并实现有效的非
滑坡样 本选择(Yao et al., 2022);(3)模型对数据敏
感,如缺失值 、噪 声和错误 数据等;(4)被认为 是“黑
箱操作”模 型 ,对 各类环境因子非线 性 耦 合 作 用 下
预测出滑坡易发性值的内部机制缺乏认识,即模型
可解释 性未 得到足 够关注 .因此研 究一种新 的用于
滑坡易发性预测的机器学习算法非常有必要 .
深度学习在一定程度上能够克服传统机器学
习的这 些 缺点,它具有学 习能力强 、覆 盖范围广 、适
应性好 等 优点,且以数据 驱动而不 需要过多 的先验
知识和假设 .目前深度学习已被广泛应用于公安服
务 领 域(Zhou et al., 2022)、医 疗 辅 助 诊 断 领 域
(Bhattacharya et al., 2021)和 公 共 安 全 领 域 等(Xu
et al., 2018),当 然也被 广泛应用于自然灾 害易发 性
预 测 等 领 域(Huang et al., 2020b; 魏 志 军 , 2020;
赵洪宝等 ,2022).上述深度学习预测滑坡易发性主
要还是从算法改进的角度出发,而没有从滑坡易发
性建模本身存在的问题出发来提升建模性能(Zhu
et al., 2020).单纯的深度学习算法改进有时难以得
到理想的滑坡易发 性 预 测 效 果 ,比如建模的滑坡‒
非滑坡样本本身就存在误差比较大的问题(黄发明
等,2020).这种滑坡‒非滑坡样本误差将会严重制约
深度学习模型的输出变量准确性,从而制约深度学
习预测滑坡易发性的精度提升 .针对该问题,本 文
提出新的深度学习算法,即基于自筛选的双向长短
时记忆网络与条件随机场(Self‐screening Bi‐direc‐
tional Long Short ‐ Term Memory and Conditional
Random Fields,S BiLS TM ‐ CRF)滑坡易发性预测
模型 .该算法预期能更准确地分析出各滑坡点之间
的相关 性 ,以 便提取出 环境因子 之间更深 层的特征
信 息 ;能 自 动 筛 选 掉 错 误 的 滑 坡 样 本 ,通 过 二 次 迭
代建模选择出准确的非滑坡样本,以便提供比原数
据更准确 的滑坡空 间 数据描述(Zhou et al., 2022).
为 体 现 SBiLSTM‐CRF 模型的优越性,本文同时
选择了 4个 传 统 机 器 学 习 模 型(即 随 机 森 林(Ran‐
dom Forest,RF)、逻 辑 回 归(Logistic Regression,
LR)、随 机 梯 度 下 降(Stochastic Gradient Descent,
SGD)、支 持 向 量 机(Support Vector Machine,
SVM))以 及 深 度 学 习 方 法 级 联 并 行 长 短 时 记 忆
网络和条件随机场(Cascade‐parallel Long Short‐
Term Memory and Conditional Random Fields,
cpLSTM‐CRF)进行比较 研 究(Zhu et al., 2020).
1697
第 48 卷
地球科学 http://www.earth‐science.net
对于滑坡易发性建模的另外一个严肃问题是
很难解释影响结果的变量或特征,即深度学习的可
解 释 性(Linardatos et al., 2020).随 着 深 度 学 习 模
型越来越广泛地应用于关键环境下的重要预测,对
机器学习的透明度也日益增高 .其危险在于创建
和使用不合理、不 合 法的决策,或 者 根 本 无 法获得
对其行为的详细解释(成 科 扬 等 ,2020;曾 春 艳等,
2021).其实无论是传统的机器学习还是深度学习,
都面临无法充分解释环境因子作用下滑坡易发
性 指 数 预 测 机 制 的 问 题(Gaur et al., 2020),尤 其
大多数以数据驱动的深度学习目前尚处于“黑盒
子 ”状 态 .为 了 解 决 这 一 局 限 性 ,本 文 重 点 分 析 各
环境因子对预测模型决策的贡献度以及与预测
结果的关联性,以获得更好的可解释性结论 .
1 滑坡易发性预测的 SBiLSTM‐CRF
模型
1.1 研 究思路
滑坡易发性预测是一个复杂的非线性建模问
题,通过常规统计方法可能无法获得令人满意的结
果.传统的处理机器学习和数据挖掘问题的方法都
需要很强的前提假设或者大量的先验知识,而且易
发性建模中也存在滑坡-非滑坡样本误差等多种
问题(Hong et al., 2020).本文拟提出了 SBiLSTM‐
CRF 这一新的深度学习模型来尝试克服上述问题,
并首次运用于滑坡预测数据集 .该算法 流程(图 1a)
如下:(1)滑坡影响因子的分析和筛选:基于滑坡编
录 信 息 与 基 础 环 境 因 子 ,采 用 频 率 比 法(胡 涛 等 ,
2020)获得各个基础环境因子的频率比 .(2)建立空
间 数 据 集 :将 处 理 好 的 频 率 比 值 作 为 模 型 输 入 变
量,构 建 滑 坡 -非滑坡的空间数据集,并划分出模
型训练集和测试集 .(3)数据自筛 选建模:通过构建
一个 Bi‐LSTM 和全连接网络的预分类自筛选网络,
并对全区进行滑坡易发性预评估 .设置阈值 t控制
T1和T0对数据集中 因人工标注 、数据采 集误差 等不
定因素导致的数据集标注结果错误数据进行筛选,
以降低易发性评价过程中的不确定性 .再从全区预
评估结 果采 用自然断 点法获得 阈值 T′
1和T′
0进行等
量补充 .(4)特征提取建模:构建级联双向 LSTM 网
络对筛选后的数据集进行更深度地提取特征,获取
更深层次的滑坡点前后的 上 下 文 信 息 和 因 子 之 间
的 关 联 信 息 .(5)序列预测建模:构建全连接二分
类网络对所提取的特征进行滑坡易发性预测,并
引 入 CRF 对结果进行综合解码,获得易发性预测
结 果 .(6)模 型 性 能 评 价 : 通过假阴性、假阳性、真
阴性、真 阳 性 等指标和 ROC 曲 线衡 量模 型 性 能 .
1.2 滑坡易发性预测模型
1.2.1 滑坡栅格样本自筛选 该 网 络 的 原 始 输 入
是处理后的延长县一维地理数据,即每个样本所
包 含 的 12 个环境因子 .通过一个 Bi‐LSTM 和 全
连 接 层 构 成 预 分 类 网 络 .经 过 简 单 的 训 练 之 后 ,
预 分 类 网 络 对 测 试 集(2 060 个)和 全 研 究 区 域 的
研 究 点(2 622 482 个)进 行 预 分 类 ,得 到 相 应 的 滑
坡 易 发 性 概 率 .通过自然断点法获得全区易发性
区 间 ,并 进 行 分 级 .本研究将滑坡易发性分为
K(K= 5 ) 个 等 级 ,分 别 为 极 低 、较 低 、中 等 、较
高 、极 高 5个等级 .对筛选阈值引入偏度以用来
度量随机变量概率分布的不对称 .公 式 如 下 :
ì
í
î
ï
ïï
ï
ï
ïï
ïT1=
||
sk ×t
1 + 2
||
sk
T0=1-T1,
,(1)
其中 t为人为设置阈值.s k 为偏度,定 义为:
sk =1
n∑
i= 1
n
[( Xi-μ
σ)3] ,(2)
其中,
μ为均值 ,
σ为标准 差 .当sk < 0 时表明 滑坡易
发 性 预 分 类 整 体 预 测 分 布 为负 偏 离 ,即 左 偏 态 ;当
sk > 0 时表明整体预分类分布为正偏离,即右偏态;
当sk = 0,表明数据集整体预分类分布为正态分布 .
根 据 阈 值 的 自 筛 选 规 则 如 下 :(1)由 预 分 类
网 络 对 延 长 县 全 研 究 区 域 进 行 滑 坡 易 发 性 预 评
估 ;(2)将人工标签为 1而滑坡易发性概率小于
T1的 栅 格 筛 除 ,将 人 工 标 签 为 0而滑坡易发性
概 率 大 于 T0的 栅 格 筛 除 ;(3) 随 机 从 延 长 县 全
研 究 区 域 滑 坡 易 发 性 预 评 估 结 果 中 筛 选 滑 坡 易
发 性 概 率 大 于 T′
1的栅格作为新的滑坡样本,筛
选滑坡易发性概率小于 T′
0的 栅 格 作 为 新 的 非
滑 坡 样 本 .其 中 T′
1和T′
0分别是预评估中由自然
间 断 点 分 级 法 获 得 的 极 高 和 极 低 的 区 间 值 .
本研究中筛选的阈值 t设置为 0.6,计 算 T1为
0.302 1,筛选正样本 87 个 ,负 样 本 130 个 ,
T′
1和T0'
分别为 0.659 9 和0.139 1. 如此筛 选 后等量补 充 ,既
减弱了滑坡易发性评价的不确定性,又维持了数据
集数据量一致,也保证了滑坡和非滑坡的类平衡 .
1.2.2 特征提取建模 特征提取部分采用 K(K=
5 ) 级Bi‐LSTM 的级联网络和全连接的前馈神经
网 络 .级 联 Bi‐LSTM 层能够更深层次地提取滑
1698
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
坡 环 境 因 子 的 深 度 特 征 和 空 间 特 征 .网络输入
层 是 环 境 因 子 的 实 矩 阵 Ri×j,其 中 行 向 量
{
i |1 ≤
i≤I,i∈Z
}
为 栅 格 个 数 ,
I为 研 究 区 栅 格 总 数 ,
列 向 量
{
j |1 ≤ j≤J,j∈Z
}
为 环 境 因 子 个 数 ,
J为
滑 坡 因 子 总 数 .滑坡因子向量进入 5个Bi ‐
LSTM 的 级 联 网 络 ,以 单 条 LSTM 链 及 LSTM
单元为例,结构如图 1b 和 图 1c 所 示 .正向传播
中 处 理 第 k层中第 i个栅格的第 j个 因 子 时 ,
LSTM 内 部 状 态 记 忆 单 元 计 算 过 程 可 表 示 为 :
C
k,i,j= tan h
(
Wc⋅
[
hk- 1,xij
]
+bC
)
,(3)
Ck,i,j=Fk,i,j×Ck- 1 +Ik,i,j×C
k,i,j ,(4)
hk,i,j=Ok,i,j× tan h(Ck,i,j) ,(5)
其 中 hk,i,j表 示 隐 藏 层 状 态 ,C
k,i,j表 示 输 入 门 基 于
先前隐藏层生成的候选状态,
Ck,i,j是前单元状
态 ,
tan h为激活函数,
Fk,i,j为遗忘门,
Ik,i,j为输入
门 ,
Ok,i,j为 输 出 门 ,计 算 过 程 :
ì
í
î
ï
ï
ï
ï
ï
ï
ï
ï
ï
ï
ï
ï
Fk,i,j=σ
( )
Wf⋅
[ ]
hk- 1,xij +bf,
Ik,i,j=σ
( )
Wi⋅
[ ]
hk- 1,xij +bi,
Ok,i,j=σ
( )
Wo⋅
[ ]
hk- 1,xij +bo,
(6)
其 中 σ表示激活函数;
Wf,
Wi和Wo表 示 LSTM
单 元 每 个 门 的 权 重 矩 阵 ;
hk- 1 ,
xij 分别表示前一
个 单 元 的 隐 藏 状 态 和 第 i个 栅 格 点 的 第 j环 境
因 子 ;
bf,
bi和bo表示相应的偏置项;
Fk,i,j输 出
介 于 0和1之间的数字 .首 先 输 入 门 产 生 候 选
状 态 ,然后用遗忘门确定丢弃的信息,与输入
门 相 加 ,实 现 LSTM 单 元 状 态 更 新 ,最 后 输 出
门根据当前单元状态输出和隐变量 .Bi‐LSTM
为 两 条 相 反 的 LSTM 链 ,公 式 可 以 表 示 为 :
ì
í
î
ï
ïï
ï
ï
ïï
ï
hfk,i,j=H(Whf ⋅
[ ]
hfk,i,j+xij +bhf )
hbk,i,j=H(Whb ⋅
[ ]
hbk,i,j+xij +bhb ) ,(7)
其中 hfk,i,j∈Ri×j,
hbk,i,j∈Ri×j分 别表示前向 层 和 后向
层 的 输 出 向 量 ,最 终 输 出 yk,i,j= [ hfk,i,j,hbk,i,j]是这两
部分的 拼 接,前向层和 后向层的 组合被定 义为单个
图1 算法流程及 Bi-LSTM/LSTM 结构示意
Fig.1 Algorithm flow and Bi-LSTM/LSTM structure
a. 算法流程 . FC. 全连接网络;Bi-LSTM . 双向 LSTM;CRF. 条件随机场;b.Bi-LS TM 链;c.LSTM 单元结构
1699
第 48 卷
地球科学 http://www.earth‐science.net
Bi‐LSTM 层.在完成一次前向传播过程中,从原始
数据输入到 SBiLSTM ‐CRF 变化公式为:
yout=∏
k=1
K∑
i=1
M∑
j=1
J
ok,i,j
×tan h
( )
fk,i,j
×Ck-1+ik,i,j
×C
k,i,j ,(8)
在 模 型 训 练 过 程 中 ,容 易 发 生 过 拟 合 问 题 ,因
此 非 常 必 要 对 网 络 使 用 Dropout 防 止 过 拟 合 ,
来实现正则化效果 .在 神 经 网 络 前 向 传 播 的
过 程 中 ,对 每 级 LSTM 层 中 的 部 分 神 经 元 按
照预设的概率随机失效 .从 而 实 现 提 高 神 经
网 络 模 型 泛 化 性 能 的 效 果 ,最 终 实 现 过 拟 合
问 题 的 改 善 ,本 文 的 Dropout 设置为 0.25.
1.2.3 序 列 预 测 建 模 在通过 K级 级 联 的 Bi ‐
LSTM 网 络 更 深 层 次 地 提 取 每 个 栅 格 点 的 每 个 滑
坡因子 之间的多维特征后 ,使用 一个由 32 个神经元
组成的全连接层将所有的特征融合起来,并使用两
个神经元进行滑坡预测 .这一过程使用 Sigmoid 函
数作为 激活 函数 .由于滑坡数据在总体上具有一定
的空间连续性,例如,在滑坡数据的周围子区域往
往 具 有 较 大 的 概 率 滑 坡 .考 虑 邻 域 中 标 注 之 间 的
相 关 性 是 必 要 的 .因此引入 CRF 对 标 签 序 列 进 行
综合解码,而 非 独 立 解码 .CRF 的特征函数分为两
类,第 一类 是 定 义 在 第 i个栅格点上的节点特征函
数,它只和当前栅格点的输出滑坡易发性评估结
果有关,第 i个栅格点 yi的节点特征函数记为:
sl
(
yi,yi
pred,i
)
,l= 1,2,...L ,(9)
其 中 L是定义在该栅格点上节点特征函数的总个
数.第二类是定义在 yi栅格点前后的局部特征函
数,它只和 当前 滑坡点 和上一滑坡 点有关 ,第 i个栅
格点 yi的局部特征函数记为:
tk
(
yi- 1,yi,yi
pred,i
)
,k= 1,2,...K ,(10)
其 中 K是定义在该栅格点的局部特征函数的总
个 数 .无 论 是 节 点 特 征 函 数 还 是 局 部 特 征 函 数 ,
它们的取值只能是 0或1,即满足特征条件或者
不 满 足 特 征 条 件 .同时每个特征函数都被赋予一
个 权 值 ,用 以 表 达 对 这 个 特 征 函 数 的 信 任 度 .线
性链条件随机场的公式可表示为:
p
(
yi|yi
pred
)
=1
Z
( )
yi
pred
exp
(
∑
i,k
λktk
(
yi- 1,yi,yi
pred,i
)
+
∑
i,l
μlsl
( )
yi,yi
pred,i
)
,(11)
其 中 tk和μl分别是 λk和sl的权重系数,Z
(
yi
pred
)
为 规 范 化 函 数 ,表 示 为 :
Z
(
yi
pred
)
=
∑
y
exp
( )
∑
i,k
λktk
( )
yi- 1,yi,yi
pred,i+∑
i,l
μlsl
( )
yi,yi
pred,i ,
(12)
为了得到最优 的模 型,需 要 训练 CRF,本文采用极
大似然估计法,似 然 函数如式(13)所示 .本文使用
了Viterbi 算 法(Forney,1973)来 优 化 CRF 计算过
程,得到经 CRF 平滑处理后的最终输出序列标签:
y=
{
y1,y2,⋅ ⋅ ⋅,
}
yn.
L
(
W
)
=∑
i
log p
( )
yi|yi
pred . (13)
1.2.4 损 失 函 数 滑 坡 环 境 因 子 原 始 数 据 差 异
较 小 ,且 不 同 环 境 因 子 对 滑 坡 的 影 响 不 同 .因 此
在 训 练 过 程 中 引 入 交 叉 熵 作 为 损 失 函 数 计 算 损
失 以 扩 大 数 据 之 间 的 差 距 ,减 小 数 值 计 算 误 差 ,
加 速 模 型 的 收 敛 .此 外 ,交 叉 熵 使 得 优 化 的 概 率
更 加 精 确 ,既 滑 坡 概 率 更 接 近 1,非滑坡概率更
接 近 0. 交 叉 熵 损 失 函 数 可 以 表 示 为 :
Lcross ‐entropy =
-1
n∑
i=1
n
(yi
Llog ( yi)+(1 - yi
L) log ( 1 - yi) ) , (14)
其 中 ,
yi表 示 数 据 真 实 标 签 值 ,
yi表示预测值,
n表示滑坡样本总数 .
1.3 滑坡易发性预测结果评价
1.3.1 统计指 标精度 评 价 本研究采用阳性预测
率(PPR)、阴 性 预 测 率(NPR)和 总 准 确 率(To‐
tal Accuracy, TA)这 几 种 统 计 指 标 来 评 价 各 模
型 的 预 测 性 能(Huang et al., 2020b).PPR 通过计
算 预 测 正 例 在 所 有 正 例 里 的 占 比 得 到 .NPR 通
过 预 测 负 例 在 所 有 负 例 中 的 占 比 得 到 .PPR 和
NPR 分 别 用 于 评 估 滑 坡 易 发 性 模 型 对 滑 坡 和 非
滑坡的预测能力 .TA 被用来评估所有测试数据
集的预测准确度 .这3个统计指标的计算如下:
TA = TP + TN
TP + TN + FP + FN , (15)
其 中 ,真 阳 性(True Positive, TP)表示 正 确 分 类 的
滑坡栅 格数;真阴性(True Negative, TN)表示正确
分 类 的 非 滑 坡 栅 格 数 ;假 阳 性(False Positive, FP)
表示错误分类的滑坡栅格数,即将非滑坡栅格错误
的分类 为滑坡栅格;假 阴性(False Negative, FN)表
示分类错误的费滑坡栅格数,即将滑坡栅格错误的
分 类 为 非 滑 坡 栅 格 .TA 表征模型总的预测精度,
TA 越大表示滑坡易发性预测准确度越高 .
1.3.2 ROC 曲线评价 接受者操作特征曲线(Re‐
1700
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
ceiver Operating Characteristic Curve, ROC),能 反
映特异性和敏感性的相互关系,被广泛应用于评价
滑坡易发性模型 的优劣(罗路 广等,2021).特异性又
称 假 阳 率(False Positive Rate, FPR),敏 感 性 又 称
真阳率(True Positive Rate, TPR),计算公 式为:
FPR = FP
FP + T N , (16)
TPR = TP
TP + F N , (17)
ROC 曲线以特 异性 为 横 坐标,以 敏感性为纵坐 标 .
通常 ROC 曲线在 y=x之 上,因此 ROC 曲线下的面
积(Area Under the Curve,AUC)一般取值范围位于
区 间[0.5, 1].ROC 曲线越接近左上角,即 AUC 越
大表示该滑坡易发性预测模型的性能越好 .
1.4 深度学习预测滑坡易发性的可解释性
近年来深度学习在研究领域取得了很多
成 果 ,但 由 于 其 缺 乏 可 解 释 性 而 降 低 了 模 型 的
可信度 .可解释性是指以可理解的术语向人类
提 供 解 释 的 能 力(Zhang et al., 2021).总体可
分为内置可解释性和事后可解释性(Alvarez‐
Melis and Jaakkola ,2018).
内置可解释性也称事前可解释性,是指模型
本身已内置可解释 性 ,发 生 在 网 络训练之前,主 要
用于较为简单的网络模型 .通 常 直 接 使 用 自 解 释
模 型 或 实 现 网 络 模 型 的 内 置 可 解 释 性(Lipton,
2018).事后可解释性旨在从已训练模型中提取信
息,主要运用于较为复杂的网络模型,可分为全局
可解释性和局部可解释性 .全 局 可 解 释 性 是 指 基
于整个数据集的特征空间 和 模 型 结 构 来 解 释 和 理
解模型决策,对 应 的 方法为全局可解释方 法 ,通 常
从模型层面进行解释;局部可解释性是指基于输
入样本的每一维特征变化 对 输 出 结 果 影 响 来 解 释
和理解模型决策,对应的方法为局部可解释方法,
通常从数据层面进行解释 .本 研 究 基 于 预 测 分 布
图和积分梯度对延长县滑 坡 空 间 数 据 集 进 行 局 部
和全局解释(Alvarez‐Melis and Jaakkola,2018).
2 研究区及滑坡编录介绍
2.1 延 长县
延长县位于陕西省东北部,总面积为
2 368.7 km²,海 拔高度为 470.6~1 383 m;延长县属
暖 温带 干 旱 大 陆 性 季 风 气 候 ,四 季 分 明 ,降 水 量
相 对 较 少 .其 地 势 由 西 北 向 东 南 倾 斜 ,南 北 高 ,中
间 低 ,呈 谷 峰 型 .河 流 弯 曲 狭 窄 ,植 被 覆 盖 率
低 ,丘 陵 沟 壑 交 错 且 河 谷 深 切 重 ;具 有 黄 土 高
原地貌,地层依次为三叠系碎屑沉积岩、上新
统 三 趾 马 红 土 、第 四 纪 体 系 .马红土分布不连
续,其上层黄土抗剪强度较差 .马兰黄土由于
其 质 纯 、疏 松 、大 孔 隙 ,属 于 滑 坡 易 发 地 层 .
该 区 滑 坡 概 况 如 图 2所 示 ,现 存 82 处 滑 坡 ,
主要类型为小型浅层覆盖滑坡 .滑坡体积以
中 小 型 为 主 ,共 计 81 处( 占 比 98.7%),主 要
分 布 在 西 部 ,大 部 分 的 滑 坡 距 离 河 流 较 近 、
具 有 相 对 较 高 的 地 势(郭 天 颂 等 ,2019).
2.2 滑坡环境因子分析
本研究用到的数据源包括:①县 国 土 资 源
部 门 调 查 的 滑 坡 编 录 信 息 和 野 外 调 查 的 相 关
资 料 ;②30 m 分辨率的 DEM 数 据 ;③1 :10 万 比
例尺的延长县岩土类型分布图;④30 m 分辨率
的Landsat TM8 遥感影像等 .根 据 野 外 实 际 情
况 ,综 合 考 虑 影 响 滑 坡 发 育 的 环 境 因 子 并 依 据
已 有 文 献 资 料 ,最 终 选 取 高 程 、坡 度 、坡 向 、剖
面曲率、平面曲率、地形起伏度、地表总辐射、
岩 性 、地 形 湿 度 指 数(Topographic Wetness In‐
dex , TWI)、归 一 化 建 筑 物 指 数(Normalized
Difference Building Index , NDBI)、归 一 化 植 被
指 数 (Normalized Difference Vegetable Index ,
NDVI)、修正归一化差异水指数(Modified
Normalized Difference Water Index , MNDW I)12
个 作 为 易 发 性 模 型 的 输 入 变 量(图 3).
图 2 延长县滑坡概况
Fig.2 Yanchang County landslide overview
1701
第 48 卷
地球科学 http://www.earth‐science.net
3 滑坡易发性建模结果
3.1 滑坡相关空间数据集
本 文 共 获 取 了 12 个环境因子作为深度学习
的 输 入 变 量 ,滑 坡 数 据 集 中 共 有 6 864 个栅格单
元 ,其 中 包 含 从 滑 坡 区 域 中 转 换 的 3 432 个滑坡
栅格单元以及从非滑坡区域中随机选择的
3 432 个 非 滑 坡 栅 格 单 元 .这些滑坡‒非滑坡栅格
分 别 被 以 70%/30% 的比例随机划分后合并为训
练 集 和 测 试 集(黄 发 明 等 ,2020).之 后 SBiLSTM‐
CRF 模 型 利 用 训 练 /测试数据集预测延长县的滑
坡 易 发 性 ,并 选 用 LR、 RF、 SVM、 SGD 等模型
做 对 比 .实验所需的硬件配置如表 1所 示 .
3.2 延长县滑坡易发性结果
3.2.1 SB iLSTM ⁃ CRF 模型预测易发性 本文提
出的 SBiLSTM‐CRF 具有对数据的自筛选功能,且
具有较深的特征提取能力 .模型以 Bi‐LSTM 和 全
连接层作为预测模型对输入的数据进行筛选,在以
级 联 Bi‐LSTM 深度学习模型进行特征提取,利用
CRF 对预测结果做综合解码 .模型采用 Adam 优化
图3 延长县滑坡环境因子
Fig. 3 Environmental factors for landslides
a. 高程;b . 坡度;c. 坡向 ;d. 平面曲率;e. 剖面曲率;f. 地表起伏度;g. 岩性;h . 地形湿度指数;i.NDVI;j.NDBI;k.MNDWI;l. 地表总辐射
1702
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
器 ,学 习 率 设 置 为 0.000 1 ;batch size 设置为 200;
LSTM 单元数设置为 32 个(即隐藏层大小设置
为32),训练迭代次数为 10 000 次.将训练好的
SBiLSTM ‐CRF 模 型 用 于 预 测 延 长 县 全 研 究 区
域 的 滑 坡 易 发 性 得 到 滑 坡 易 发 性 图(Landslide
Susceptibility Mapping, LSM).此 外 ,根 据 自 然 间
断 点 分 级 法(Yao et al., 2008)将 延 长 县 划 分 为
极 高 、高 、中 等 、低 、极 低 5个 等 级 并 计 算 出 相 对
应 的 面 积 占 比 分 别 为 :12.80% ,13.21 % ,
13.67% ,19.53% 和40.77%(图 4a,表 2).
3.2.2 CPLSTM ⁃ CRF 模 型 预 测 易 发 性
CPLST M‐C RF 模型 采用 Ad am 优化器,学习率设置
为0.001,batch size 设置为 200,unit 设置为 32 个且训
练 迭 代 次 数 为 8 000 次(Huang et al.,2020b).将 训
练好的 CP LST M ‐C RF 模 型 用 于 预 测 延 长 滑 坡
易 发 性 得 到 LSM 图.根据自然间断点法对研究
区 域 分 为 极 高 、高 、中 等 、低 、极 低 5个等级并计
算 出 相 对 应 的 面 积 占 比 分 别 为 :8. 59% , 9.33% ,
13.92% , 22.36% 和45.80% (图 4b ,表 2).
3.2.3 RF 模型 预 测 易 发 性 RF 是 基 于 树 模 型 的
分类器,是滑坡预发性预测的常用模型 .RF 精 度
主要采用因子特征数量 m和树的数量 t等参数来
调整 .基于袋外误差筛选法确定 RF 模型预测延长
县 滑 坡 易 发 性 时 ,其 m和t的参数分别设置为 3和
800 (吴 润 泽 等 ,2021).同样将 RF 模型用于预测
延长县全研究区域的滑坡易发性得到 LSM 图.
其 中 RF 模 型 预 测 的 极 高 、高 、中 等 、低 、极 低 滑 坡
易 发 区 的 面 积 占 比 分 别 为 : 10.02% , 16.86% ,
21.99% , 24.59% 和26.54%(图 4 c ,表 2).
3.2.4 LR, SVM 和SG D 模型预测易发性 LR 模
型由线性回归模型方程与 Sigmoid 函 数 共 同 组 成 .
其本质是假设数据服从某一分布,然后使用极大似
然估计做参数的估计(李文彬等,2021).LR 具有实
现 简 单 高 效 易 解 释 、计 算 速 度 快 、易 并 行 的 特 点 .
在 对 LR 建 模 时 ,设 置 L2 正 则 惩 罚 项 以 增 强 抗 扰
动 能 力 ,惩 罚 系 数 C设置为 0.5 ,停 止 标 准 设 置 为
10- 4 .LR 模 型 预 测 的 极 高 、高 、中 等 、低 、极 低 滑
坡 易 发 区 的 面 积 占 比 分 别 为 :10.90% ,16.85% ,
21.52% ,25.53% 和25.19%(图 4 d ,表 2).
SVM 模型的惩罚系数 C设 为 1.0;核 函 数 采
用径向基;核函数系数 γ设 为 0.3(Yao et al.,
2008).SVM 预 测 的 极 高 、高 、中 等 、低 、极 低 滑 坡
易 发 区 的 面 积 占 比 分 别 为 :14 .87% ,1 6.45 % ,
18 .76% ,22.84% 和27.08%(图 4e).SGD 模型是
广 泛 使 用 的 优 化 算 法 , SGD 采 用 L2 范数作为罚
项 类 型 ,罚 项 系 数 α设置为 0.000 1(Hong et al.,
2020).SGD 模 型 预 测 的 极 高 、高 、中 等 、低 、极 低
滑 坡 易 发 区 的 面 积 占 比 分 别 为 :1 5.20 % ,
18 .46% ,20 .16% ,22.15% 和24.03%(图 4f ,表 2).
3.3 易发性建模结果评价
3.3.1 统计指标精度 各滑坡预测模型的统计测
量结果 如表 3所示 .结 果表明 ,SBiLSTM ‐CRF 在阴
性预测 率 、阳 性预测率 和总的预 测率上均 比其他传
统机器学习模型和深度学习具有更好的预测性能 .
自筛选的方式有效去除了错误样本,为模型学习提
表1 实验平台软硬件环境
Table 1 Software and hardware environment of the experimental platform
实验 平台
配置
处理 器
(CPU)
显卡
(GPU)
RAM
参数
Intel(R) C ore(TM ) i5-7400@3.00 GHz
Nvidia GeForce GTX1080
8.00 GB DDR4
实验
平台
配置
内存
(ROM)
操作
系统
开发
环境
参数
Western Digital WDC WD10EZEX-08WN4A0
Windows10 + Ubuntu18.04
Python3.6.5 + TensorFlow1.14.0 +
Keras2.1.4 + Matlab 2018
表2 滑坡易发性评估统计结果
Table 2 Statistical results of landslide susceptibility evalua‐
tion
预测 模型
SBiLSTM-CRF
cpLSTM-CRF
RF
LR
SVM
SGD
易发性等级 (%)
极高
12.80
8.59
10.02
10.9
14.87
15.2
高
13.21
9.33
16.86
16.85
16.45
18.46
中等
13.67
13.92
21.99
21.52
18.76
20.16
低
19.53
22.36
24.59
25.53
22.84
22.15
极低
40.77
45.80
26.54
25.19
27.08
24.03
1703
第 48 卷
地球科学 http://www.earth‐science.net
供了高质量的数据 .级联的 L STM 可以捕获更深层次
的因子间的交互关系,使其优于其他机器学习模型 .
3.3.2 ROC 曲 线 ROC 曲 线 用 模 型 命 中 率 和 误
报 率 来 评 价 模 型 性 能 ,AUC 表 示 ROC 曲线下的
面 积 ,主 要 用 于 衡 量 模 型 的 泛 化 性 能 .ROC 曲 线
如 图 5 所 示 .可 以 看 出 ,SBiLSTM‐CRF 在精确率
和召回率都明显优于其他模型 .揭 示 了 SBiL ‐
STM‐CRF 克 服 了 其 他 模 型 的 局 限 性 ,通 过 级 联
LSTM 明显增强了模型的非线性表达能力 .
4 讨论
4.1 模型迭代分析
SB iLST M ‐ CRF 训练损失值和测试准确率随
迭代次数增加的变化曲线如图 6 所示 .可以看出迭
代500 次内 ,准确率停 滞 在 0.5 没 有 上 升,但 这 并不
意味着模型没有更新 .相反,模型在停滞过程中 loss
急速下降 .模型迭代次数在 2 000 次内 ,损失值从 4
迅速下 降到 0.5,而 后缓慢降低 ,并趋于 平稳 .同时,
图 4 滑坡易发性图
Fig. 4 Landslide susceptibility maps
a.SBiLSTM-CRF;b.cpLSTM-CRF;c.RF;d. LR ;e. SVM ;f.SGD
1704
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
准 确 率 迅 速 从 0.5 上 升 至 0. 8 ,而 后 逐 渐 达 到 稳
定 ,并 趋 于 平 稳 .这表明模型具有较快的收敛
速 度 和 稳 定 的 收 敛 性 能 .
4.2 SBiLST M⁃CRF 模型分析
滑坡易发性建模结果表明,SBiLSTM ‐ CRF
模型性能优于以往的 CP LST M ‐C RF 和传统的
RF 、LR、SVM、SGD 等机器学习模型 .这是因为
SBiLSTM‐CRF 模型在易发性建模过程中表现出
了 诸 多 优 点 .比如该模型使用自筛选模块以解决
人 工 标 注 错 误 、数 据 采 集 误 差 等 不 定 因 素 带 来 的
偏 差 ;建 模 时 提 出 使 用 Bi‐LSTM 以增加网络宽
度,并以级联的方式增加网络的深度;CRF 能 进
一步分析栅格点之间的双能量关系使得滑坡预
测 概 率 更 平 滑 .SBiLSTM‐CRF 能更充分地拟合
数据以便学习环境因子间的非线性关系,具有自
动 筛 选 错 误 数 据 、特 征 提 取 能 力 强 的 优 势 .SBiL‐
STM‐CRF 模 型 同 时 还 具 有 自 筛 选 的 能 力 和 良 好
的 可 解 释 性 .然而在网络拥有良好的特征提取能
力 和 优 秀 的 分 类 能 力 的 同 时 ,SBiLSTM ‐CRF 和
其他的深度学习和机器学习网络相比更为复杂 .
因此,是否能在尽量不牺牲精度的前提下对模型
进行剪枝和优化,将成为下一步改进的方向 .
4.3 SBiLST M⁃CRF 的易发性建模可解释性
本文分 别 从单因子 影响滑坡 易 发性、双因子交
互作用以及因子贡献度等 领 域 出 发 对 深 度 学 习 预
测滑坡易发性进行解释(Linardatos et al., 2020).
4.3.1 单 因 子 通 过 将 滑 坡 样 本 输 入 到 网 络 中 获
得滑坡易发性概率,统计环境单因子的预测分布图
可解释 性 ,可 以从自然 成因层面 直观揭示 出不同单
因 子 对 滑 坡 易 发 性 预 测 结 果 的 影 响(曾 春 艳 等 ,
2021).对测试集中 2 060 个样本进行统计可以得出
各个环境因 子在各区间的分 布,如图 7 所示 .以坡度
为例,根据坡度 的分布,对每个 样本进行 统计,得到
坡度在各个区间的预测分布如图所示 .上半部分的
箱型图表示各区间滑坡易发性概率的分布情况,箱
型 图 中 的 数 字 表 示 该 区 间 概 率 统 计 的 二 分 位 数
(Q2);下 半部分 的柱状 图表示 该区间 内样本点的数
量统计情况,柱状图中的 数字表示该区 间样 本个数 .
由图 7a可以看出,坡度在 0°~8.8°和8.8°~12.1°
区间内 的样 本量较 少,分别为 140 例 和 221 例,分 别
约 占 总 量 的 6.8% 和10.7%;21.9°~41°区间内的样
本量最大,为 582例,约占总量的 2 8.3% . 坡度在 0°~
12.1°呈现出非常低的滑坡易发性概率,均小于 0.2,
两个区间内的 Q2 都 为 0.085;坡度在 19.1°~21.9°和
41.0°~50.3°区间 内的 滑 坡 易发性概率 集中 在 0.5~
0.9,Q2 为0.671;坡 度 在 21.9° ~41°时 ,滑 坡 易 发 性
图 6 L oss 和acc uracy 随迭代次数曲线
Fig.6 Loss and accuracy curves with number of iterations
表3 不同模型对延长县滑坡预测的性能对比
Table 3 Comparison of landslide prediction performance of
different models in Yanchang County
模型
TP
TN
FP
FN
PPR (%)
NPR(%)
TA (%)
SBiLSTM-
CRF
849
857
173
181
83.07
82.56
82.82
CPLSTM -
CRF
809
701
329
221
71.09
76.03
73.30
RF
813
771
259
217
75.84
78.04
76.89
SVM
767
729
301
263
71.82
73.49
72.62
LR
729
724
306
301
70.43
70.63
70.53
SGD
813
616
414
217
66.26
73.95
69.37
图 5 各滑坡易发性预测模型的 R OC 曲线
Fig.5 ROC curves for each landslide susceptibility prediction
model
1705
第 48 卷
地球科学 http://www.earth‐science.net
概 率 集 中 在 0.6~0.9,Q2 为0.845,表现出了具有
较 高 的 滑 坡 易 发 性 概 率 (郭 果 等 ,2013).坡度作
为易发性评价中重要的环境因子,其大小直接影
响 了 滑 坡 的 发 生 ,在 坡 度 为 0°~41.0°内 ,研 究 区 域
内 的 滑 坡 易 发 性 概 率 随 坡 度 增 大 而 增 大 ,而 在
41.0°~50.3°区间内滑坡易发性概率较21.9°~41.0°
内 有 所 下 降 .这是因为坡度较小通常坡体比较稳
定,而坡度大通常滑坡风化层不易累计、人类活动
影响较小、坡 体排水良好 ,反 而不易发生 滑坡 .
由图 7b 可看 出,NDVI 在0~0.099、0.449~1 区
间的数据较少,样本数 为 3例,占 比约 0.15%;NDVI
在0.113~0.122、0.237~0.243、0.259~0.270、
0.347~ 0.398 之 间的 数据量 同样较 少,样 本数为 118
例,占比约 5.7% . 在随着 NDVI 的增大,并没有呈现
出 较 强 的 规 律 性 ,NDVI 在0.113~0.122、0.237~
0.243、0.259~0.270、0.347~0.398 之间时,超过一半
的 滑 坡 易 发 性 概 率 都 落 在 了 0~0.5,其 Q2 为
0.397;而 在 0.157~0.197 区 间 内 ,超 过 一 半 的 滑 坡
易发性概率都落在了 0.5~0.9,Q2 为0.599. 植 被
覆 盖 度 是 生 态 环 境 的 一 个 重 要 参 数(Moragues et
al., 2020),影 响 着 斜 坡 体 表 面 土 体 的 流 失 速 率
和 土 壤 侵 蚀 程 度 .NDVI 较低时,通常为水系、城
市和裸地,通常没有滑坡发育的条件;NDVI 较 高
时 ,边 坡 抗 剪 强 度 和 抗 渗 透 性 较 好 ,人 类 工 程 活
动 减 少 ,不 利 于 滑 坡 ,同 时 较 高 的 植 被 也 不 利 于
人类观测,因此有记录的滑坡频次较少 .
4.3.2 双因子交互作用 在 单 因 子 的 统 计 上 ,进
一步统计双因子交互作用,以下选取相关性较高
的6个结果做分析 .以DEM 和Slope 为 例 ,根 据
DEM 和Slope 分别的结果进行统计,得到 DEM
和Slope 双因子交互如图 8a 所示,图中展示每个
各因子每个区间的分布情况,圆中的数字分别表
示当前区间下的样本量和平均滑坡易发性概率,
圆的大小表征样本量的多少,圆的颜色深浅表征
滑坡易发性概率的大小(成科扬等,2020).
如图 8a 可知,当坡度 在 0°~12.1°时 堆积物 抗滑
性能大于下滑性能,形成不了滑坡 .在 高 程 不 变 的
情况下,滑坡易发性概率随着坡度的增大先增后
减,并 在 21°~41.0°达到了最 大 ;在 同 一 坡度下随 着
高程越大增大先 增后 减,并 在 866.6~979.4 m 区间
达 到 了 最 大 .在 高 程 为 866.6~979.4 m,Slope 在
21°~41.0°区间内的滑坡易发性概率(0.855)达 到 最
大.说明高程在 866.6~979.4 m 区间内利于滑坡堆
积成物 质 发育,容易接受 一些坡积 物和洪积 物的沉
积.岩石经过风化以后,容易从高程为 979.4~
1 369.8 m 的区域通过坡积过程搬运到高程为
866.6~979.4 m 的区域,此时再遇到 19.1°~50.3°的
坡度即沉积下来的堆积物就容易发育成滑坡 .如图
8b 所 示 ,在 地形 起 伏度在 18.0~84.6 m 且不变的情
况下,滑坡易发 性概率随 着地形湿 度的增 大 先增大
图 7 滑坡易发性预测单因子可解释性结果
Fig.7 One-way interpretable results for landslide susceptibility prediction
a. 坡度;b.NDVI
1706
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
后 减 小 .在地形起伏度为 33.1~84.6 m 和地形湿
度 为 0~0.123 时 ,平 均 滑 坡 易 发 性 概 率(0.757)
达 到 最 大 .在地形湿度较大的区域边坡堆积层
含 水 量 较 高 且 坡 体 抗 剪 强 度 较 低 ,在 合 适 的 地
形 起 伏 度 下 ,容 易 发 育 成 滑 坡(冯 霄 等 ,2022).
然 而 ,当 地 形 湿 度 过 大 时 通 常 为 水 系 发 达 地
区 ,该 区 域 由 于 水 体 的 冲 刷 作 用 ,使 得 坡 积 物
和 洪 积 物 无 法 堆 积 反 而 不 利 于 滑 坡 发 育 .
4.3.3 滑坡环境因子贡献度解释 本文对逐条样
本根据各滑坡环境因子做积分梯度并取期望值,
获 得 各 因 子 贡 献 度 .为简化计算基线设置为 0,近
似方法使用的步数设置为 50. 最 后 基 于 积 分 梯 度
计 算 的 滑 坡 环 境 因 子 对 SBiLSTM‐CRF 做决策的
贡 献 度 总 和 结 果 显 示 :(1) 地形地貌和基础地质
对 滑 坡 贡 献 度 较 大 ,约 为 0.31 和0.18.(2) 地表覆
盖 和 水 文 环 境 对 滑 坡 的 贡 献 度 较 小 ,约 为 -0.03
和0.02.(3) 坡 度 、岩 性 、高 程 对 滑 坡 影 响 起 主 要
作 用 ,分 别 约 为 0.14, 0.12 和0.08,这也与前面的
结 果 吻 合 .(4) NDVI 为负贡献度(约- 0.04),
MNDWI 的 贡 献 度 几 乎 为 0,NDBI 的贡献度不足
0.01. 上述结果表明 NDVI、MNDWI 和NDBI 并
不 是 造 成 延 长 县 滑 坡 发 育 的 主 要 相 关 因 子 .具
有 黄 土 高 原 地 貌 的 延 长 县 的 滑 坡 受 坡 度 、岩
性 、高 程 、坡 向 和 地 形 起 伏 度 的 影 响 较 为 明 显 .
5 结论
本文提出了一种基于 Bi‐LSTM 的 新 型自筛选
级联双 向 LSTM‐CRF 网络模型开展滑坡易发性预
测建模 .模型与 CPLSTM‐CRF 和传统的机器学习
图8 滑坡易发性预测的双因子交互可解释性结果
Fig.8 Two-factor interactive interpretability results
a. 高程与坡度;b. 地形起伏度与 TWI
1707
第 48 卷
地球科学 http://www.earth‐science.net
(RF , SVM , SGD , LR)模 型 相 比 表 明 ,模 型 具
有显著的优越性,建模结果均优于其他模型 .
本 文 使 用 滑 坡 自 然 原 理 可 解 释 性 和 深 度 学 习 网
络 可 解 释 性 ,使 S BiL STM ‐ CR F 从以往的黑盒
子 开 始 白 盒 化 .结果表明就滑坡易发性数据集
而言,坡度、高程、岩性、地表起伏度和坡向等
滑 坡 因 子 控 制 了 延 长 县 堆 积 层 滑 坡 发 育 .在 海
拔 为 866.6~979.4 m ,坡 度 为 21.9°~41° ,地 形 起
伏 度 为 33.1~84.6 m ,岩 性 为 T3y,地形湿度为
0~0.123 时 利 于 滑 坡 发 育 .总 之 ,SBiLSTM ‐
CRF 模型因为其非线性表征能力和可解释性
而拥有显著的滑坡易发性预测建模实用性 .
References
Alvarez ‐Melis, D., Jaakkola, T. S., 2018. Towards Robust
Interpretability with Self ‐ Explaining Neural Networks.
Advances in Neural Information Processing Systems 31
(NeurIPS 2018). https://arxiv.org/abs/1806.07538
Bhattacharya, P., Tanwar, S., Bodke, U., et al., 2021.
BinDaaS: Blockchain‐Based Deep ‐Learning as‐a‐Service
in Healthcare 4.0 Applications. IEEE Transactions on
Network Science and Engineering, 8: 1242-1255.
Cheng, K. Y., Wang, N., Shi, W. X., et al., 2020. Re‐
search Advances in the Interpretability of Deep Learn‐
ing. Journal of Computer Research and Development, 57
(6): 1208-1217 (in Chinese with English abstract).
Eiras, C., Souza, J., Freitas, R., et al., 2021. Discriminant
Analysis as an Efficient Method for Landslide Suscepti‐
bility Assessment in Cities with the Scarcity of Predispo‐
sition Data. N atural Hazards, 107: 1427- 1442.
Fang, R. K., Liu, Y. H ., Su, Y. C., et al., 2021. A Early
Warning Model of Regional Landslide in Qingchuan
County, Sichuan Province Based on Logistic Regres‐
sion. Hydrogeology & Engineering Geology, 48(1):
181-187 (in Chinese with English abstract).
Feng, X., Wang, Y., Liu, Y., et al., 2022. Susceptibility
Assessment of a Translational Rockslide Considering
the Control M echanism and Spatial U ncertainty of a
Weak Interlayer: Application Study in Tiefeng Town ‐
ship, Wanzhou District. Bulletin of Geological Science
and Technology, 41(2): 254- 266 (in Chinese with
English abstract).
Forney, G.D., 1973. The Viterbi Algorithm. Proceedings of
the IEEE, 61: 268-278.
Gaur, M., Faldu, K., Sheth, A., 2020. Semantics of the
Black ‐ Box: Can Knowledge Graphs Help Make Deep
Learning Systems More Interpretable and Explainable?.
IEEE Internet Computing, 25: 51-59.
Guo, G., Chen, Y., Li, M.H., et al., 2013. Statistic Rela‐
tionship between Slope Gradient and Landslide Proba‐
bility in Soil Slopes around Reservoir. Journal of Engi‐
neering Geology, 21(4): 607-612 (in Chinese with
English abstract).
Guo, T. S., Zhang, J. Q., Han, Y., et al., 2019. Evaluation
of Landslide Susceptibility in Yanchang County Based
on Particle Swarm Optim ization ‐Based Support Vector
Machine. Geological Science and Technology Informa‐
tion, 38(3): 236-243 (in Chinese with English abstract).
Hong, H. Y., Tsangaratos, P., Ilia, I., et al., 2020. In‐
troducing a Novel Multi ‐ Layer Perceptron Network
Based on Stochastic Gradient Descent Optimized by a
Meta‐Heuristic Algorithm for Landslide Susceptibility
Mapping. The Science of the Total Environment,
742: 140549. https://doi. org/10.1016/j. scito‐
tenv.2020.140549
Hu, T., Fan, X., Wang, S., et al., 2020. Landslide Sus‐
ceptibility Evaluation of Sinan County Using Logistics
Regression Model and 3S Technology. Bulletin of Geo‐
logical Science and T echnology, 39(2): 113-121 (in
Chinese with English abstract).
Huang, F., Cao, Z., Jiang, S. H., et al., 2020a. Landslide
Susceptibility Prediction Based on a Semi ‐ Supervised
Multiple ‐ Layer Perceptron Model. L andslides, 17:
2919-2930.
Huang, F., Zhang, J., Zhou, C., et al., 2020b. A Deep
Learning Algorithm Using a Fully Connected Sparse Au‐
toencoder Neural Network for Landslide Susceptibility
Prediction. Landslides, 17: 217- 229.
Huang, F. M., Ye, Z., Yao, C., et al., 2020. Uncertainties
of Landslide Susceptibility Prediction: Different Attri‐
bute Interval Divisions of Environmental Factors and
Different Data ‐ Based Models. Earth Science, 45(12):
4535-4549 (in Chinese with English abstract).
Jia, G., Gariano, S.L., Tang, Q., 2021. Advancing Rainfall‐
Induced Landslide Detection Using Homogeneous Slope
Units and Distributed Rainfall Thresholds. EGU Gener‐
al Assembly Conference Abstracts, EGU21-6145.
Khan, R., Yousaf, S., Haseeb, A., et al., 2021. Exploring
a Design of Landslide Monitoring System. Complexity,
2021: 5552417. https://doi.org/10.1155/2021/5552417
Li, W. B., Fan, X. M ., Huang, F. M., et al., 2021. Uncer‐
tainties of Landslide Susceptibility Modeling under Dif‐
ferent Environm ental Factor Connections and Prediction
Models. Earth Science, 46(10): 3777-3795 (in Chinese
1708
第 5 期黄 发明 等:基 于自 筛选 深度 学习 的滑 坡易 发性 预测 建模 及其 可解 释性
with English abstract).
Luo, L. G., Pei, X. J., Huang, R. Q., et al. 2021. Evalua‐
tion of Landslide Susceptibility in Jiuzhaigou Scenic Spot
by CF and Logistic Regression Coupled with GIS. Jour‐
nal of Engineering Geology, 29: 526-535 (in Chinese
with English abstract).
Linardatos, P., Papastefanopoulos, V., Kotsiantis, S.,
2020. Explainable AI: A Review of Machine Learning
Interpretability M ethods. Entropy (Basel, Switzerland),
23(1): 18. https://doi.org/10.3390/e23010018
Lipton, Z.C., 2018. In Machine Learning, the Concept of In‐
terpretability is Both Important and Slippery. Queue,
16: 28.
Moragues, S., Lenzano, M. G., Lanfri, M., et al., 2020.
Analytic Hierarchy Process Applied to Landslide Suscep ‐
tibility Mapping of the North Branch of Argentino Lake,
Argentina. Natural Hazards, 105: 915-941.
Pradhan, B., 2013. A Comparative Study on the Predictive
Ability of the Decision Tree, Support Vector Machine
and Neuro ‐ Fuzzy Models in Landslide Susceptibility
Mapping Using GIS ‐Science Direct. Computers & Geo‐
sciences, 51: 350- 365.
Tian, N. M., Lan, H. X., Wu, Y. M., et al., 2020. Perfor‐
mance Comparison of BP Artificial Neural Network and
CART Decision Tree M odel in Landslide Susceptibility
Prediction. Journal of Geo ‐Information Science, 22(12):
2304-2316 (in Chinese with English abstract).
Wei, Z.J., 2020. Multi‐Stage Series Deep Convolutional Neu ‐
ral Network Medical Image Registration Method (Disser‐
tation). Hunan University, Changsha (in Chinese with
English abstract).
Wu, R. Z., Hu, X. D., Mei, H. B., et al., 2021. Spatial
Susceptibility Assessment of Landslides Based on Ran ‐
dom Forest: A Case Study from Hubei Section in the
Three Gorges Reservoir Area. Earth Science, (1): 321-
330 (in Chinese with English abstract).
Xu, M ., Feng, Q., Mei, Q., et al., 2018. Deep Type: On‐
Device Deep Learning for Input Personalization Service
with Minimal Privacy Concern. Proceedings of the ACM
on Interactive Mobile Wearable and Ubiquitous Tech ‐
nologies, 2: 1-26.
Yao, J., Qin, S., Qiao, S., et al., 2022. Application of a
Two ‐ Step Sampling Strategy Based on Deep Neural
Network for Landslide Susceptibility Mapping. Bulletin
of Engineering Geology and the Environment, 81:
1-20.
Yao, X ., Tham, L., Dai, F., 2008. Landslide Susceptibility
Mapping Based on Support Vector Machine: A Case
Study on Natural Slopes of Hong Kong, China. Geomor‐
phology, 101: 572-582.
Zeng, C.Y., Yan, K., Wang, Z.F., et al., 2021. Survey of
Interpretability Research on Deep Learning Models.
Computer Engineering and Applications, 57(8): 1- 9
(in Chinese with English abstract).
Zhang, Y., Tino, P., Leonardis, A., et al., 2021. A Survey
on Neural Network Interpretability. IEEE Transactions
on Emerging Topics in Computational Intelligence, 5:
1-17.
Zhao, H. B., Liu, R., Liu, Y. H., et al., 2022. Research on
Classification and Identification of M ine Microseismic
Signals Based on Deep Learning Method. Journal of
Mining Science and Technology, 7(2): 166-174 (in Chi‐
nese with English abstract).
Zhou, T., Wu, W., Peng, L., et al., 2022. Evaluation of
Urban Bus Service Reliability on Variable Time Hori‐
zons Using a Hybrid Deep Learning Method. Reliability
Engineering and System Safety, 217(3):108090.
Zhu, L., Huang, L. H., Fan, L. Y., et al., 2020. Landslide
Susceptibility Prediction Modeling Based on Remote
Sensing and a Novel Deep Learning Algorithm of a
Cascade ‐ Parallel Recurrent Neural Network. Sensors
(Basel, Sw itzerland), 20(6): 1576. https://doi. org/
10.3390/s20061576
附中文参考 文献
成科扬, 王 宁, 师文喜, 等, 2020. 深度学习可解释性研究进
展. 计算机研究与发展, 57(6): 1208-1217.
方然可, 刘 艳辉 , 苏 永超 , 等, 2021. 基于逻辑回归的四川 青
川县区域滑坡灾害预警模型 . 水文地质工程地质, 48
(1): 181-187.
冯霄 , 王 禹, 刘洋 , 等, 2022. 考虑软弱夹层控滑机制及其空
间不确 定 性的顺层 岩 质滑坡 易 发性评 价 : 万 州 区铁峰
乡应用研究 . 地质科技通报, 41(2): 254-266.
郭果 , 陈 筠, 李明惠, 等, 2013. 土质滑坡发育概率与坡度 间
关系研究 . 工程地质学报, 21(4): 607-612.
郭天颂, 张菊清, 韩煜 , 等, 2019. 基于 粒子群优化支持向量
机 的 延 长 县 滑 坡 易 发 性 评 价 . 地质科技情报, 38(3):
236-243.
胡涛, 樊鑫, 王硕, 等, 2020. 基于逻辑回归模型和 3S 技 术
的 思 南 县 滑 坡 易 发 性 评 价 . 地质科技通报, 39(2):
113-121.
黄发明, 叶舟 , 姚池 , 等, 2020. 滑坡 易 发性预 测 不确定 性:
环境因子不同属性区间划分和不同数据驱动模型的影
响. 地球科学, 45(12): 4535-4549.
李文彬, 范 宣梅 , 黄 发明 , 等, 2021. 不同环境因子联接和 预
测模型的滑坡易发性建模不确定性 . 地球科学, 46
1709
第 48 卷
地球科学 http://www.earth‐science.net
(10): 3777-3795.
罗路广 , 裴向军 , 黄润秋, 等 ,2021. GIS 支持下 CF 与 Lo‐
gistic 回归模型耦合的九寨沟景区滑坡易发性评价 . 工
程地质学报, 29:526-535.
田乃满, 兰 恒星 , 伍 宇明 , 等, 2020. 人工神经网络和决策 树
模型在 滑坡 易发 性分析 中的 性能 对比 . 地 球信 息 科学
学报 , 22(12): 2304-2316.
魏志军 ,2020. 多级串联深度卷积神经网络医学图像配准方
法(硕士 学位 论文 ). 长 沙:湖南大学 .
吴润泽, 胡 旭东 , 梅 红波 , 等, 2021. 基于随机森林的滑坡 空
间易发性评价: 以三峡库区湖北段为例 . 地球科学, 46
(1): 321-330.
曾春艳, 严 康, 王志锋, 等, 2021. 深度学习模型可解释性研
究综述 . 计算机工程与应用, 57(8): 1-9.
赵洪宝, 刘 瑞, 刘一洪, 等, 2022. 基于深度学习方法的矿山
微 震 信 号 分 类 识 别 研 究 . 矿业科学学报, 7(2):
166-174.
1710