比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

ICCV论文收录名单近日「开奖」,其中就包括这个港科大一作的图像分割模型!

它能以更低的训练成本实现更好的效果,哪怕遇到未知物体也能迎刃而解。

此外据作者介绍,它还是第一个拥有基于box prompts的分割能力的AI模型,比meta的SAM还要早实现。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

这篇论文第一版预印本的发布时间是今年的3月14日(北京时间15日),比SAM早了20多天。

那么,这个图像分割模型,究竟效果如何,又是如何做到的呢?

(以下内容由投稿者提供)

下图展示了这个名为OpenSeeD的模型的输出效果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

它既可以做经典的实例、语义以及全景分割,又可以分割出从未见过的物体类别,还可以基于检测框分割出从未见过的物体并给出正确的类别。

工作原理

OpenSeeD是一个简单而有效的开放词表图像分割的框架,也可以理解为MaskDINO扩展到开放词表的版本。

如下图所示,过去已经有不少工作结合大量的图像文本对实现开词表检测或者分割,而OpenSeeD是第一个把物体检测数据和全景分割数据结合在一起联合训练的工作,并且证明是可行有效的,填补了这一领域的空白。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,为了扩展语义的丰富程度,研究团队引入O365(365类)检测数据和COCO分割(133类)一起训练(不同于MaskDINO使用O365预训练)。

由于使用了不同的数据集,研究团队需要解决了二者之间的数据和任务的差异,以便两个任务和词表兼容。

整体上,OpenSeeD的工作原理如下图所示,两种差异也是通过这一方式解决的:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

图中左半部分完成的是通用场景分割。

为了解决基础模型的任务差别(O365只有前景,而COCO有前景和背景),研究团队把前景和背景的预测进行解耦。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

右半部分是条件预测部分,可以通过GT box预测图像遮罩。

在这一部分中,团队通过为O365打标签为了解决数据差异问题。

最终,该团队的方法在多个开放词表任务上取得了与当前最佳方法x-decoder相当甚至更好的效果,相比x-decoder用了4M人工标注的图像描述数据,OpenSeeD只用了0.57M的检测数据。

另外,研究团队还发现,即使只用5k的O365数据,也可以在开放词表任务上达到类似的效果。

这说明OpenSeeD需要的是丰富的视觉概念(种类数),而不一定是很大的数据量(个体数)。

低成本,高效果

OpenSeeD作为一个强大的开集分割方法,可以分割出大量从未见过的物体,在各项开集和闭集指标上都取得了最佳成绩。

而且通过引入O365检测任务来提升开集语义能力,OpenSeeD的训练成本也相对其他开集方法更低。

下表展示了OpenSeeD的测试结果:

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

通过较少的检测数据,研究团队发现在多个零训练样本分割任务上达到或超越了现有最佳方法X-Decoder,GLIPv2等,尤其在SeginW任务(大量陌生类别)上取得了远超X-Decoder的效果。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

除此以外,当团队微调到其他数据集时,OpenSeeD都表现出了远超参照标准的性能。

在COCO和ADE20K的全景分割以及ADE20K和Cityscapes的实例分割上,OpenSeeD的性能也与现有最佳模型相当。

比Meta「分割一切AI」更早实现交互式开集分割!港科大开放词表分割大法入选ICCV 2023

论文地址:

https://arxiv.org/abs/2303.08131

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年7月22日 12:18
下一篇 2023年7月22日 12:23

热点推荐

  • 对话星城微创:一年成为头部,好的管理制度如何赋能一家直播机构

    这是一家MCN机构成功转型为直播机构的故事。 2017年,星城微创做MCN机构,并打造出了众多头部IP。2019年,星城微创看到了整个行业发生了巨大的变化,为内容型机构释放了利好信号。 因此,星城微创迅速切换赛道,入局直播。202…

    热点 2023年5月26日
    112
  • 抖音小店无货源怎么做起来

    抖音作为目前最火爆的短视频社交平台之一,随着流量的不断增长,这里已经成为很多创业者开展电商业务的首选平台。但是,对于一些没有货源的人来说,如何在抖音上开设小店呢?现在无货源模式也比较火,也是很多人的开店首选模式,下面来看看抖音小店…

    热点 2023年9月9日
    92
  • 男生问你卡吗是什么意思(男生问你卡吗是什么意思)

    最近网上又有不少新梗引起大家的好奇,男生问你卡吗是什么意思?关于卡吗这个网络词语还是有非常多的含义,不同的语境情况下意思都是不一样的,而男生问你卡吗是有什么特殊含义呢?卡的网络用语到底指的是什么?下面来看下梗的出处及意思介绍。 男…

    热点 2023年7月21日
    160
  • 破碎锤品牌大全(破碎锤品牌排行榜)

    破碎锤哪个牌子好 有很多,例如:阿特拉斯、卡玛兹、水山、东空、古河、迈科、工兵等。 欧美品牌:芬兰的锐猛、阿特拉斯(以前的克虏伯)、美国的英格索兰蒙特贝,品质高价格更高。日系品牌:古河、东空、太石克。韩系:韩宇、大漠、水山、工兵。…

    热点 2023年10月31日
    330
  • 交警执法时棍击电动车致人受伤,涉事警务人员已被停职并接受调查。

    2023年11月29日下午4点多钟,贺州市公安局交通警察支队四大队在八步区信都镇开展交通违法整治行动。然而,一名驾驶无号牌二轮电动车的男子逃避检查,警务人员在拦截中使用警棍时造成二轮车失控,导致该驾驶员倒地受伤。执勤人员立即拨打1…

    热点 2023年12月8日
    115
  • 江山就是人民,人民就是江山

    增进民生福祉,提高人民生活品质 习近平在二十大报告中提出,增进民生福祉,提高人民生活品质。 习近平说,江山就是人民,人民就是江山。中国共产党领导人民打江山、守江山,守的是人民的心。治国有常,利民为本。为民造福是立党为公、执政为民的…

    热点 2022年10月18日
    189
  • 今日中国再不是1931年的中国!

    918事变 九一八事变,又称奉天事变、柳条湖事件。是1931年9月18日夜日本在中国东北蓄意制造并发动的一场战争,是日本帝国主义企图以武力征服中国的开端。 日军挑衅 1931年9月18日晚10时许,日本关东军在沈阳北大营南将南满铁…

    热点 2022年9月20日
    132
  • gta5线上双人任务有哪些

    gta5线上双人任务有全福银行、去飞行驾校学习飞机驾驶、突袭人道实验室。 游戏的背景多是设定在模仿美国各城市的虚构地点,游戏主要着重在开放世界的设定上,玩者可自由决定任务进行的时间和方式来推动故事剧情,此外也有许多附加任务可供选择…

    热点 2023年10月12日
    137
  • 女子逼停汽车泼粥骂渣男 网友:不管发生什么都不该糟蹋粮食

    5月20日,广东东莞一女子逼停汽车,将3桶热粥泼在车上,边泼边骂“渣男”。 据悉,拍摄者称车主就在路旁。最终,警方赶到现场后,调解双方纷争,女子也被送往警署接受调查。 有网友看到这一幕后表示,不管发生什么事都不该糟蹋粮食。 还有网…

    热点 2023年5月21日
    117
  • 日本的第2球出界了吗??德媒提出不满!球迷怒斥国际足联:腐败

    日本的第2球出界了吗?德媒提出不满!球迷怒斥国际足联:腐败。2022年卡塔尔世界杯E组最后一轮,日本队以2-1击败西班牙队,德国队以4-2击败哥斯达黎加队,这样一来,日本队就以6分力压两大世界冠军,以小组第一的身份晋级淘汰赛,西班…

    2022年12月6日 热点
    138

发表回复

登录后才能评论