Accurate land use and land cover (LULC) mapping based on remote sensing image classification has been a hot topic nowadays. Recently, deep learning, especially convolutional neural network, has achieved promising results in computer vision tasks, which has also been introduced into the field of LULC mapping. Compared with classic machine learning methods, deep learning is capable of extracting the most representative features from remote sensing images, however, its performance is depended on massive labeled data. Considering deep learning has been widely used in LULC classification, the objective was to provide a comprehensive review of deep learning from the following perspectives as sample dataset, model structure and training strategy. Specifically, from the perspective of samples, the most commonly used LULC sample dataset was summarized and their academic influence was analyzed. From the perspective of models, the latest research of deep learning models were reviewed, including convolutional neural network, recurrent neural network, fully convolutional network. From the perspective of training strategies, various training methods that could tackle the data-hunger issue of deep learning were summarized, including active learning, semi-supervised learning, weakly-supervised learning, self-supervised learning, transfer learning. Finally, an outlook of deep learning in LULC mapping was provided, which was still from three perspectives of sample dataset, model structure and training strategy. Through the construction of large-scale LULC sample dataset, improvement of deep learning model structure and the increase of spatial-temporal generalization capability under limited samples, LULC remote sensing classification could yield a better performance and accuracy in future study.
土 地 覆 被 ( Land use and land cover,
如何基于 遥感影像 实现 土地利 用 覆被的自动分类
成为研究热点问题[1 - 8 ]
1  深度学习样本 模型 算法框架图
Fig. 1  Flow chart of sample model strategy for deep learning
在深度 9] 土地利用
[10 - 11] 其中人工设特征归一
等光谱指数纹理特征缨帽变换特征等[12 - 13]
为主[ 14 - 17] 人工设计特征对专家知识的要求很
领域[ 18 - 22] 鉴于深度习的 研究
对深度学 习在土地 利用 覆被遥感分类中的研究进
后从样本角度出发对现有的土地利用 覆被遥感分
综述土地利用 覆被遥感分类中用到的各种深度
后对未来研究方向进行展望深度学习样本 模型
算法总体框架如图 所示
1  人工智能与深度学习技术概述
1. 1  人工智能
能的 理 论 方 法技术及应用系统的一门技术科
[23] 随着大数据技术以及高性能计算的发展和
网络实现对人类大脑认知过程的模拟[9 ]
1. 2  深度学习
深度学 习 可以 看 作 经典 人 工 神 经网 络 的
版本通过增加含层数量从而提高 学习
1. 2. 1  卷积神经网络
卷 积 神 经 网 络 ( Convolutional neural network
CNN)主要用于计算机视觉Computer vison, CV)
[24 - 27] 通过卷积池化等操作对图像的高层语义
一个典 VGG[ 25] 主要包
行连接分类层主要采用 softmax 分类器
1. 2. 2  循环神经网络
循环神经网络Recurrent neural network, RNN)
的输入一般为 视频等其隐含
自输入层同时来自 - 1 时刻隐含层的输出
状态[ 31] 用的循环神经网络包括长短时记忆网
Long short term memory, LSTM) [28] 门控循环
( Gated recurrent unit, GRU )[29] 、 Transformer[30]
然的优势[31] 已经被应用在多时相遥感影像分析
1. 2. 3  生成对抗网络
生成 对 抗网 络 ( Generative adversarial network,
GAN) [32] 包 括生 成 器 ( Generator, G ) 和 判 别 器
Discriminator, D 其中生成器
实图像而判别器 主要对生成的图像进行真假判
生成对抗网络的训过程min - max
随着网络的迭代训练生成器 与判别器
生成的图像十分接近真实情况判别器 无法判断
出 图 像 真 假对于给定图像预测为真的概率为
50% 。 在遥感领域生成对抗网络主要用于模拟样
1. 2. 4  全卷积神经网络
全卷积神经网络( Fully convolutional network,
FCN)是将卷积神经网络 CNN 中的全连接层替换为
医学图像分割领域[33 - 36] 得到相比于基于
可以减少冗余计算提高大范围土地利用 覆被制图
的效率受到了广泛关注[ 37 - 38 ] 经典的全卷积神经
络 包 括 FCN[ 39] 、 UNet[40 - 42] 、 DeepLab[ 43 - 46] 等 模
2  地利用 覆被遥感分类样本研究进展
从样本角 度来综 述土地 利用 被遥
样本数据 随着深度学习的快速发
卷积神网络[47 - 49] [ 50 - 51]
积神经网络[52 - 53] 等模型均被应用到土地利用
遥感分类 然而如何验证不同模型之间的可比
感器类型时间 空间 光谱分辨率等为相关研究提
于遥感场景识别数据用一个 ×大小图像块
image⁃patch) 表示一种土地利用 覆被类型而像
            冯权泷 等土地利用覆被深度学习遥感分类研究综述
地利用 覆被的边界进行像素级别的标注
2. 1  图像块级土地利用 覆被遥感分类样本集
基于图像 块的土 地利用 覆被样本集与遥感场
景识别数据集类似其标注过程表现为对一个 ×
的图像块赋以特定的土地利用 覆被类别
该样本 集 对 应 的 深 度 学习 模 型 多 为 基 于 CNN
RNN 的图像分优势是标注过程简单劣势
如表 图像块级样本集多以航空影像
UC Merced[54 ] 、SAT 4 SAT 6[58] 和高分辨率
Google Earth 卫 星 影 像 WHU RS19[55]
AID[60 ] 为主空间分辨率多在 0. 3 ~ 2 m 之间
2  图像块级土地利用 覆被样本示例[54]
Fig. 2  LULC sample based on image⁃patch[54]
1  图像块级土地利用 覆被遥感分类样本集
Tab. 1  Commonly used LULC sample dataset based on image⁃patch
 数据集名称 数据源 样本数量 样本尺寸
像素 ×像素
/ m 波段数 土地利用
覆被类别数 发布年份 文献序号
UC Merced 航空影像 2 100 256 × 256 0. 3 21 2010 [ 54]
WHU RS19 Google Earth 1 005 600 × 600 0. 5 19 2010 [ 55]
RSSCN7 Google Earth 2 800 400 × 400 0. 25 ~ 2 2015 [ 56]
Brazilian coffee scenes SPOT 50 004 64 × 64 10 2015 [57 ]
SAT 4 SAT 6 航空影像 500 000 / 405 000 28 × 28 4 / 6 2015 [58 ]
SIRI WHU Google Earth 400 200 × 200 12 2016 [ 59]
AID Google Earth 10 000 600 × 600 30 2017 [60 ]
EuroSAT Sentinel 27 000 64 × 64 10 / 20 / 60 13 10 2019 [61 ]
考虑到深学习 签样
据集Sentinel 等多光谱卫星影像作为数据
上述样本 集在土 地利用 覆被类别数量的设定
概要性的地物类别SAT 数据集仅包含裸地
森林草地和其它共 类土地覆被类型另一方面
部分数据集则更关注土地利用 覆被的精细分类
UC Merced、WHU RS19、AID 等包含几十种具有特
定语义的土地利用 覆被类别
2. 2  像素级土地利用 覆被遥感分类样本集
基于像素 的土地 利用 覆被样本集与遥感语义
物涵盖的所有像素进行标注3) 该样本集对应
由于逐像 素的土 地利用 覆被制图能够提供更
3  像素级土地利用 覆被样本集示例[62]
Fig. 3  LULC sample based on pixel[62]
域的研究有着重要意义[63] 其样本数据集的发布也
一些最近发布的数据集DeepGlobe、GID) 其样
量和空间分辨率较高但 仅 为 一 般 的 RGB
RGB NIR 影像光谱分辨率较低
2  像素级土地利用 覆被遥感分类样本集
Tab. 2  Commonly used LULC sample dataset based on pixel
  数据集名称 数据源 样本数量 影像尺寸
像素 ×像素
/ m 波段数量 土地利用
年份 文献序号
Houston ITRES 349 × 905 2. 144 15 / 20 2014 [64 ]
Kennedy Space Center(KSC) AVIRIS 614 × 512 18 224 13 2014 [65
Botswana EO 348 × 512 30 242 14 2015 [65 ]
Indian pines AVIRIS 145 × 145 20 224 16 2015 [65 - 66 ]
Salinas AVIRIS 521 × 217 3. 224 16 2015 [65 ]
University of Pavia ROSIS 610 × 610 1. 3 103 2015 [65 ]
DeepGlobe Mix 803 2 448 × 2 448 0. 5 2018 [62]
GID GF 150 6 800 × 7 200 1 / 4 15 2020 [67]
遥感影像分类数据集 航空影像 3 750 × 1 580 0. 5 250 19 2020 [68
覆被类别设定GIC 发布的 Indian pines 数据集供
包含玉米小麦等 16 种土地覆被类别,GID
集则包含了工厂居民区灌丛等共 15 种土地利 用
2. 3  土地利用 覆被遥感分类样本集影响力分析
Google Scholar 数作
力指标对常用土地利用 覆被遥感分类样本集进行
影响力分析基于 度的
本集影响力较大GIC 发布的 Indian
pines[65 - 66 ] University of Pavia[ 65] 数据集为代表
由该团队发布的 Salinas[65KSC65] 数据集也具有
据集 UC Merced[ 54] 有最高影响力国内学者提出
AID[60 RSSCN756] 数据集发布时间相对较晚
3  于深度学习的土地利覆被遥感分类
  从模型角度综述土地利用 覆被遥感分类中常
用的深度 包括卷积神经网络 CNN
环神经网络RNN)全卷积神经网络 FCN)
4  常用土地利用 覆被遥感分类样本集影响力
Fig. 4  Impact statistics of commonly used LULC
sample dataset
3. 1  基于卷积神经网络的土地利用 覆被分类
在土地利用 覆被分类中被广泛应用在前期研究
的经典模 AlexNet、VGG、ResNet 或者自行搭
然后在整个研究区的影像上以滑窗sliding window)
式得到逐像素或逐图像块的预测结果其 中
REZAEE [69] 采用ImageNet 上预训练的 AlexNet
类似的研究如文献[70 - 76] 。
然而上述研究 CV 经典模型并没
研究人员转向 或双分支卷积神经网络的
子网 HUANG [77设计了一个双路卷积
            冯权泷 等土地利用覆被深度学习遥感分类研究综述
个分支 ImageNet 上预训练的 AlexNet
联形成的小卷积网络small DCNN)用于提取光谱
特征最后采用特征堆叠的方法进行空间 光谱特征
的融合并基WorldView 高分
港和深圳的城市土地利用制图取得了 91. 25
分类精度类似的研究如文献[78 - 80] 。
分类 精 度同时针对滨海湿地土地覆被分类问
[81] 通过引入多源光学雷达遥感影像提出了一
河三角洲 93. 78的分类精度并验证了多
[82] 城中[ 83] 等土地利 用 覆被中的专题要素进
5  多路卷积神经网络模型 81]
Fig. 5  Multi⁃branch convolutional neural network model[81]
3. 2  基于循环神经网络的土地利用 覆被分类
虽然不能像 CNN 那样对遥感影像的空间特征进
行提取RNN 对光谱特征和时序特征的学习能
要强于 CNN,同样被广泛应用于土地利用
遥感分类研究中[84 - 92]
在光谱特征提取方面,RNN 被用于多光谱和高
依赖关 MOU [85] 针对高光谱影像的土地利
覆被分类较早使用 LSTM、GRU 等循环神
覆被类别并在 个航空高光谱数据集上验证了
RNN 模型的分类 后续研究则集中在如何继
续优RNN 模型结构从而提高光谱特征提取能
文献86] 研究具有典型性通过构建级联 RNN
模型进行高光谱分类该模型由 NN
其中第 RNN 用于去除高光谱影像中的冗余
波段RNN 则利用剩余波段进行影像分类
在时序特征提取方面,RNN 被用于多时相遥感
土 地 利 用 覆 被 分 类 精 度其 中, RUΒWURM
[88] 基于多时相 Sentinel 号影像分别采用
LSTM GRU 构建了土地覆被分类模型并在 17
地物分类中取得了 90% 的精度验证了 RNN 在时
特征提取中的有效性类似研究有文献89 -
91] 均采 RNN 对耕地中的农作物进行了精细
3. 3  基于卷积 循环神经网络的土地利用
考虑到 CNN 的优势在于遥感影像的空间特征
提取RNN 的优势在于光谱特征和时序特征提
因此将 CNN RNN 进行耦合可以实现空
覆被分类的精度其中MEI [93] 基于高光谱
高分类精度 MOU [94] 构建了一个 CNN RNN
合模型实现了光谱 空 特征有效
CNN 谱 空
RNN 用于提 通过级联
CNN RNN 模型实现了 土地利 用 覆被的变化检
类似的研究还包括文献[95 - 98] 。
笔者针对 小尺度 的土地 利用 被精
构建了一种基于循环注意力网络的 CNN RN
耦合模型[99] 应用在多时相无人机可见光影像的
模型取得 92. 80的分类精度并验证了循环注
6  循环注意力网络模型 99]
Fig. 6  Attention⁃based recurrent convolutional
neural network[99]
3. 4  基于全卷积神经网络的土地利用 覆被分类
相比于 CNN、RNN 等模型以基于图像块的方式
进行土地利用 覆被分类全卷积神经网络可以实现
像素级的地物分类在大范围土地利用 覆被制图时
其计算效率高的优势较为明显其中 FCN 是计算
泛应 用 于土 地 利 用 覆 被 分 类 领 域其中张宏鸣
[100] 利用 FCN 8s 模型对灌区无人机影像进行了
渠系提取杨亚男等[101] FCN 模型对无人
同时研究人员在 FCN 的基础上进行了模型改
如孙钰 102] 针对无人机影像农业塑料覆被
类任务对 FCN 模型进行了改进,SHRESTHA 103]
提出了一种增FCN 模型用于提高建筑物的分
类精度相关研究还包括文献[104 - 105] 。
同时,UNet 以模型结构简洁鲁棒性高等优势
改 进并广泛应用于土地利用覆 被 分 类 中
DIAKOGIANNIS [106] 提出了一种 UNet
学习方法进行组合同时改Dice 损失以解决样本
不平衡 提 高 了 土 地 利 用 覆被的分类精度
YE [107] 将空间 光谱注意力机制应用于 UNet
[106 - 113] 。
DeepLab 列模型也在土地利用覆被分类中
得到了广泛应用其中 LIN 114] 利用道注
模块对 DeepLab 模型进行改进以提升模
特征 并将其应用于道路提取吴永静
[115] 采 用 ResNet 50 作 为 特 征 提 取 网 络 对
DeepLab 进行改进并基于高分辨率遥感影像实现
[72 ,115 - 119 ]。
4  本稀疏条件下土地利覆被遥感分类
    相比于计算机视觉领域土地利用 覆被遥感分
本稀疏条 件下的土 地利 用 覆被遥感分类算法的研
4. 1  基于主动学习的土地利用 覆被遥感分类
泛化能力[120 - 122]
其选择策略种类较多主要划分为 基于无
标签样本的不确定性如委员会查询[ 123] 基于无
签样本对模型的响程Fisher [124 ]
于无标签样本的分布情况如流形学习[ 125] 、KL
[127 - 135] 并被应用到土地利用覆被遥感分类中
HAUT [131] 设计了一种主动学习策略用于贝叶斯
经网 络 以 适 应 多 种 高 光 谱 影 像Indian Pines、
            冯权泷 等土地利用覆被深度学习遥感分类研究综述
Salinas 等公 开 数 据 集 上 实 现 了 较好 的 分 类 结 果
杨承文等[132] 深度贝斯网络与主动习策
研究还包括文献[130 ,133 - 134 ]。
计 以 提 高 无 标 签 样 本 选 择 的 合 理 性其 中
ZHANG [135] 提出了一种结合主动学习的多度量
损失函数Houston Indian Pines 数据上验
4. 2  基于半监督学习的土地利用 覆被遥感分类
动学习中大量的人工干预[136 - 137] 半监督学习主要
数据集对模型进行继续训[138] 后者主要依赖对
而增 强 后 的 样 本 之 间其预测标签应当保持一
[139 ]
由于土地利用 覆被分类往往难以获得海量
,CENGGORO [140] 采用了一种变分半监督学习
模型进行优化以解决土地利用 覆被分类中的样本
筛选并生成高质的伪签样 通过
城市防尘绿网的遥感分类问题构建了一种 two⁃step
的半监督[ 143] 首先筛选高概率的无
top⁃k 的标签样本具有 的类该类
7  多门控机制的半监督深度学习框架 142]
Fig. 7  Multi⁃gate semi⁃supervised learning method 142]
  除了上述伪标签样方法 一致性正则化方
法也得到ZHANG [144] 提出了一种
基于半监督学习的语义分割网络( S4Net ),
DeepGlobe 数据集上取得了具有竞争力的结果
4. 3  基于弱监督学习的土地利用 覆被遥感分类
Inexact supervision)问题[146] 即基于粗粒度的上游
图像块级 别或低分 辨率 的土地 利用 覆被标注的情
况下去实现像素级别或高分辨率的土地利用 覆被
定的缓 在近期受到了遥感研究人员的关
[147 - 151] SCHMITT [147] 探索了如何使
被分类图首先采用 MODIS 500 m 分辨率的全球
DeepLab v3 + UNet 语义分割模型在高分辨
Sentinel 影 像 数 据 集 SEN12MS 上进行训练并 在
DFC2020 数据集的验证集上进行精度评估虽然作
覆 被 样 本 比 较 容 易 获 得相似的研究还包括文
[148SCHMITT [147] 直接使用低分辨
率的样本对模型进行训练,WANG [149]
像块级的标签样本和类激活图( Class activation
maps, CAMs的方法获取像素级的伪标签并将
标签加入标签样本集UNet 语义分割模型进行重
的有效性针对跨领域的土地利用 覆被分类问题
LI [150] 提出了一个基于弱监督束的语义割模
以及弱 改善了模型的分类
4. 4  基于自监督学习的土地利用 覆被遥感分类
本身出发构建学习算[ 153] 主要通设计
如 灰 度 图 像 上 色[ 154] 拼 图 游 戏[155] 图 像 修
[156] 来对模型进行预训练从而更好完成下游
其中 AYUSH [157 提出了地理感知自监督对
齐的方式并结合影像拍摄地点的知识Map of
the World 数据集上MoCo v2 模型提升了 8%
精度 REN [158] 提出一种基于相互息的自监
模型并首次将自监督学习应用于 PolSAR 土地覆被
制图的性能文献159 - 160 ]进行了类似研究
4. 5  基于迁移学习的土地利用 覆被遥感分类
迁移学习主要 源域和目标域
间的模型对齐问[ 161] 虑到遥感像具
学习网络的微调法fine tune) 即属于此类方法
WURM [162] 利用在 QuickBird 上训好的
移 至 具 有 不 同 光 谱 波 段 的 Sentinel
TerrasSAR 并对贫民窟这一独特的土地利用
源传感器QuickBird SAR)之间的学习效果较差
而对于同源感器 QuickBird Sentinel 2 ) 之间
在基于域适应的迁移方面,QIN [163] 提出了一
种基于张量对齐的适应 Domain adaptation, DA)
高了 目 标 域 内 土 地 利 用覆被分类的精度
[164 - 165进行了类似研究
在基于对抗学习的迁移方面,XU [166] 采用
应方法以缓解类间不平问题文献[ 167 - 168
5  究展望
5. 1  大规模遥感样本数据集构建
利用 覆被遥感分类中的性能很大程度上取决于样
为了解决 土地利 用 覆被遥感分类中深度学习
训 练实 际 上在 计 算 机 视 觉 领 域正 是 由 于
ImageNet 等大规模开源数据才有效
            冯权泷 等土地利用覆被深度学习遥感分类研究综述
UC Merced、AID 等场景识别数据集类似用一个遥
感图像块来表示某一种特定的土地利用 覆被类型
样本数据 集可以提 供每 一种土 地利 用 覆被类型的
5. 2  深度学习模型结构优化
在当前土地利用 覆被遥感分类研究中研究人
络结构 其时空泛化能力仍存在
5. 3  稀疏样本下深度学习模型泛化性能提升
利用 覆被遥感分类中可用的样本数量总是较少
疏条件下的时空泛化能力上述样本 模型 算法的
改进将持 续推动深 度学 习在土 地利 用 覆被制图中
            冯权泷 等土地利用覆被深度学习遥感分类研究综述
