遥感图像应用于分类、变化检测等领域,深度学习方法促进了遥感图像解译的快速发展。最广泛使用的训练范式是使用ImageNet预训练模型来处理指定任务的遥感数据。
但也存在自然场景与遥感场景存在领域差距、遥感模型泛化能力差等问题。因此,有必要开发一个具有通用遥感特征表示的基础模型。由于有大量未标记的数据可用,自监督方法在遥感方面优于全监督方法。
该研究旨在提出一个遥感基础模型框架,该框架可以利用生成式自我监督学习对遥感图像的好处。RingMo是一个大规模数据集,通过从卫星和航空平台收集200万张遥感图像构建,覆盖全球多个场景和对象。此外,遥感基础模型训练方法是针对复杂遥感场景中的密集和小型物体设计的。
RingMo是第一个跨模态遥感数据的生成基础模型。未来,该模型可应用于3D重建、住宅建设、交通、水利、环保等领域。