博客
关于我
OpenCV与AI深度学习 | 使用 SAM 和 Grounding DINO 分割卫星图像
阅读量:791 次
发布时间:2023-02-23

本文共 1231 字,大约阅读时间需要 4 分钟。

Echo与Shapes:数据驱动的城市分析

Echo公司的使命是通过数据让世界变得更易理解,从而帮助企业加速创新。我们为多个行业的客户提供数据解决方案,涵盖零售、保险、广告等领域。我们的产品线主要分为数据、洞察和技术三大部分,其中数据产品是我们的核心之一。

Shapes数据集是我们数据业务的重要组成部分。它包含地理空间多边形数据,涵盖建筑物覆盖区、停车场、太阳能电池板等城市特征。这一数据集不仅是我们的主营产品,也是其他数据集的重要输入。例如,计算某地的停留时间,需要了解其边界信息。

在实际应用中,我们遇到了一个关键问题:如何获取高质量的地理空间数据集。虽然有一些免费许可的数据集可以参考,但它们存在多个局限性。例如,OpenStreetMap (OSM)虽然覆盖范围广,但在非城市区域的准确性不足。Microsoft Building FootprintsGoogle Open Buildings虽然数据质量高,但主要集中在美国和欧洲,无法满足全球客户的需求。

**Overture Maps Foundation (OMF)**虽然结合了多个开源数据源,但其数据更新依赖于成员的利益驱动,这对我们的数据源控制构成了风险。我们需要一个更加灵活和自主的解决方案。

**Segment Anything Model (SAM)**的发布为我们提供了一个全新的工具。2023年4月由Meta推出的SAM,是一款开源基础模型,专为图像分割设计。尽管它主要针对高分辨率照片,但在卫星图像上的表现也颇为出色。SAM在小于1米分辨率的卫星图像上表现最佳,尤其是在与边界框提示结合使用时效果更佳。

为了提升SAM的性能,我们引入了Grounded SAM。通过结合文本提示和图像嵌入,我们可以更精准地定位图像中的特征。例如,使用Grounding DINO模型生成图像嵌入,并结合SAM进行分割。这种方法不仅提高了模型的零散弹性能,还为后续的数据微调提供了可靠基础。

在实际应用中,我们面临两个主要挑战:图像嵌入的计算量和标注的耗时性。通过与专业图像注释服务Encord合作,我们可以高效地完成标注工作。虽然这一过程耗时且成本较高,但它是确保模型性能的唯一可靠方法。

为了加快处理速度,我们选择了Google Cloud作为云平台,并搭配Apache Beam分布式计算框架。Beam的执行引擎Dataflow提供了丰富的功能,特别适合处理大规模的图像数据管道。我们的处理流程结合了自定义Python库和外部机器学习模型,确保了计算效率的最大化。

未来,我们计划通过持续收集高质量的卫星图像和专业标注数据,不断优化模型性能。这不仅有助于提升产品竞争力,也为客户提供更精准的数据支持。通过自主研发和数据源控制,我们希望在数据驱动的城市分析领域保持领先地位。

文章结束,感谢阅读。您的点赞、收藏和评论是我们持续创作的动力。欢迎在评论区留言,分享您的技术心得,共同学习成长。

转载地址:http://yhsfk.baihongyu.com/

你可能感兴趣的文章
ObsoleteAttribute 可适用于除程序集、模块、参数或返回值以外的所有程序元素。 将元素标记为过时可以通知用户:该元素在产品的未来版本中将被移除。...
查看>>
OC block声明和使用
查看>>
OC Xcode快捷键
查看>>
oc 中的.m和.mm文件区别
查看>>
OC 中的重写 OC中没有重载 以及隐藏
查看>>
OC 内存管理黄金法则
查看>>
oc57--Category 分类
查看>>
occi库在oracle官网的下载针对vs2008
查看>>
OceanBase 安装使用详细说明
查看>>
OceanBase详解及如何通过MySQL的lib库进行连接
查看>>
ocp最新题库之052新题带答案整理-36题
查看>>
OCP题库升级,新版的052考试题及答案整理-18
查看>>
OCR:文字识别(最详细教程)
查看>>
OCR使用总结
查看>>
octave错误-error: ‘squareThisNumber‘ undefined near line 1 column 1
查看>>
Octotree Chrome插件离线安装
查看>>
OC中关于给NSString 赋 nil和@""的区别
查看>>
OC字符串方法汇总
查看>>
OC点语法介绍和使用以及@property关键字
查看>>
oc知道经纬度求位置
查看>>