您的当前位置:首页>资讯 > 正文

“跨次元”目标检测模型hold住各种画风 还能识别漫画中物品

  • 2022-01-16 15:18:12 来源:量子位

目标检测种类多达20000+种的AI,你见过吗?

不仅准确“揪出”每个物体所在的位置,分类效果非常准确:

插画版赛博恐龙也没问题:

甚至还能检测杂志封面甚至漫画中的物体!

这也是把目标检测给玩出花来了,据作者表示模型在长尾问题等细节上的处理非常好,像狮子和狐狸这种少样本也能准确识别:

这项研究来自Meta AI和德克萨斯大学奥斯汀分校,一作是著名目标检测框架CenterNet的作者、复旦校友Xingyi Zhou。

一起来看看。

可识别“跨次元”物体

这篇论文提出了一种新的名为Detic的方法,用来解决目标检测无法用到图像级标签(给一整张图打标签,标注里面有什么物体)的问题。

此前的目标检测方法,通常是一个检测框里一个物体:

这种方法有一个问题,就是没办法利用整个图像级标签,只能用单个物体的图片进行训练。

也有一些研究想出了一种新方法,搞个弱监督学习,试图让AI自己学会将图像级的标签,去对应锚定框里面有什么物体,但实际上这种方法的效果也不太好。

Detic的方法是采用目标检测数据(a)和图像标签数据(b)对Detic进行混合训练。

其中,在用目标检测数据训练Detic时,同时对图像分类模块W和目标检测模块B进行训练,但只用标签数据对图像分类模块W进行训练。

训练的数据集采用的是ImageNet,事实证明模型在训练后无需微调,就能很好地适应到LVIS等数据集,相对之前的一些模型都达到了不错的效果:

论文表示,Detic能分类的图片类型也是多种多样,从真实照片到赛博恐龙插画这样的“跨次元”作品都能识别:

这立刻吸引了不少网友来玩。

在线Demo可玩

有网友用梵高的世界名画试了试。

放大一点来看,艺术加工后的椅子、人和桌子也能被识别:

还有用二次元的龙猫进行识别的,除了龙猫本身被错认成猫头鹰以外,其他的雨伞和靴子都认得不错:

我们也随便用一个钟表柜的照片试了试,在线Demo的检测时间稍微有点久,大约需要6分钟左右,但效果还不错:

细看的话还是能发现一些瑕疵,例如把部分手表误认成转速计、以及怀表和时钟,以及也有一两块手表没有被检测出来。

不过,即使在二次元和插画中,这个AI能识别的物体,至少也需要在真实世界出现过。

例如,超出20000个分类的物体,如喷火龙和皮卡丘,就不在AI的监测范围内了,全部被认成了猴子(狗头):

将这些二次元角色也加入AI训练数据集中,不知能否取得同样的检测效果。

标签: 物体 标签 图像 模型 目标 ai detic 论文 数据 漫画

推荐阅读

科学家开发出可用于仿生眼的低功率系统

仿生眼植入物在现有的眼睛结构内或在大脑中工作。

奥密克戎全国多地散发 张文宏最新解读上海疫情

“只要是涉及到的风险区一定要追踪到位,但是也绝不能盲目扩大风险区。”

首例猪心移植人体 科学家们可以从中学到什么?

初战告捷,我们可以从中学到什么呢?

你的眼睛一天内经历几万次“失明” 只是为了让你看清世界

这么看来,想要做人造眼睛的难度又提升了不少。

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

业界