世界聚焦：CVPR2023论文总结！CV最热领域颁给多模态、扩散模型

首页 > 资讯 > > 内容页

世界聚焦：CVPR2023论文总结！CV最热领域颁给多模态、扩散模型

发表于: 2023-05-22 23:05:46 来源：面包芯语

点击上方↑↑↑“OpenCV学堂”关注我

来源：公众号新智元授权

一年一度的CVPR即将在6月18-22日加拿大温哥华正式开幕。

(相关资料图)

每年，来自世界各地的成千上万的CV研究人员和工程师聚集在一起参加顶会。这个久负盛名的会议可以追溯到1983年，它代表了计算机视觉发展的巅峰。

目前，CVPR的h5指数所有会议或出版物中位列第四，仅次于《自然》、《科学》和《新英格兰医学杂志》。

前段时间，CVPR公布了论文接收结果。根据官网上统计数据，一共接受论文9155篇，录用2359篇，接受率为25.8%。

此外，还公布了12篇获奖候选论文。

那么，今年的CVPR有哪些亮点？从录用论文中我们又能看到CV领域有哪些趋势？

接下来一并揭晓。

初创公司Voxel51就所有被接收论文列表中进行了分析。

先来整体看一张论文标题的汇总图，每个字的大小与数据集中出现的频率成正比。

简要说明

- 2359篇论文被接收（9155份论文提交)

- 1724篇Arxiv论文

- 68份文件提交到其他地址

每篇论文的作者

- CVPR论文的平均作者约为5.4人

- 论文当中作者最多的是: 「Why is the winner the best?」有125位作者

- 有13篇论文只有一个作者。

主要Arxiv分类

在1724篇Arxiv论文中，有1545篇，或者说接近90%的论文将cs.CV列为主要类别。

cs.LG位列第二，有101篇。eess.IV （26）和 cs.RO （16）也分得一杯羹。

CVPR 论文的其他类别包括: cs.HC，cs.CV，cs.AR，cs.DC，cs.NE，cs.SD，cs.CL，cs.IT，cs.CR，cs.AI，cs.MM，cs.GR，eess.SP，eess.AS，math.OC，math.NT，physics.data-an和stat.ML。

「Meta」数据

- 「数据集」和「模型」这2个词共同出现在567篇摘要中。「数据集」在265篇论文摘要中单独出现，而「模型」则单独出现了613次。只有16.2%的 CVPR接收论文没有包含这两个词。

- 根据CVPR论文摘要，今年最受欢迎的数据集是ImageNet（105），COCO（94），KITTI（55）和CIFAR（36）。

- 28篇论文提出了一个新的「基准」。

缩写词比比皆是

似乎没有首字母缩略词就没有机器学习项目。2359篇论文中，1487篇的标题有多个大写字母的缩略词或复合词，占比63%。

这些首字母缩略词中有一些很容易记住，甚至可以脱口而出：

- CLAMP: Prompt-based Contrastive Learning for Connecting Language and Animal PoseCLAMP

- PATS: Patch Area Transportation with Subdivision for Local Feature Matching

- CIRCLE: Capture In Rich Contextual Environments

有些则要复杂得多：

- SIEDOB: Semantic Image Editing by Disentangling Object and Background

- FJMP: Factorized Joint Multi-Agent Motion Prediction over Learned Directed Acyclic Interaction GraphsFJMP

他们中的一些人似乎在首字母缩略词构建上借鉴了别人的创意：

- SCOTCH and SODA: A Transformer Video Shadow Detection Framework（荷兰流行潮牌Scotch & Soda）

- EXCALIBUR: Encouraging and Evaluating Embodied Exploration（Ex咖喱棒，笑）

除了2023年的论文标题，我们抓取了2022年所有接受的论文标题。从这两个列表中，我们计算了各种关键词的相对频率，从让大家对什么是上升趋势、什么是下降趋势有更深入的了解。

模型

2023年，扩散模型（Diffusion models）占据了主导地位。

扩散模型

随着Stable Diffusion和Midjourney等图像生成模型的走红，扩散模型发展的火热趋势也就不足为奇了。

扩散模型在去噪、图像编辑和风格转换方面也有应用。把所有这些加起来，到目前为止，它是所有类别中最大的赢家，比去年同期增长了573% 。

辐射场

神经辐射场（NERF）也越来越受欢迎，论文中使用单词「radiance」增加了80% ，「NERF」增加了39% 。NeRF已经从概念验证转向编辑、应用和训练过程优化。

Transformers

「Transformer」和「ViT」的使用率下降并不意味着Transformer模型过时，而是反映了这些模型在2022年的主导地位。2021年，「Transformer」这个词只出现在37篇论文中。2022年，这个数字飙升至201。Transformer不会很快消失。

CNN

CNN曾经是计算机视觉的宠儿，到了2023年，似乎失去了它们的优势，使用率下降了68%。许多提到 CNN 的标题也提到了其他模型。例如，这些论文提到了CNN和Transformer：

- Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth EstimationLite-Mono

- Learned Image Compression with Mixed Transformer-CNN Architectures

任务

掩码任务和掩码图像建模相结合，在CVPR中占据了主导地位。

生成

传统的判别任务，如检测、分类和分割并没有失宠，但是由于生成应用的一系列进步，它们在CV的份额正在缩小，包括「编辑」、「合成」以及「生成」的上升就证明这点。

掩码

关键字「mask」比去年同期增长了263% ，在2023年被接收的论文中出现了92次，有时在一个标题中出现了2次。

- SIM: Semantic-aware Instance Mask Generation for Box-Supervised Instance SegmentationSIM

- DynaMask: Dynamic Mask Selection for Instance SegmentationDynaMask

但大多数（64%）实际上指的是「掩码」任务，包括8个「掩码图像建模」和15个「掩码自动编码器」任务。此外，还有8篇出现「掩码」。

同样值得注意的是，3篇带有单词「mask」的论文标题实际上指的是「无掩码」任务。

零样本vs小样本

随着迁移学习、生成方法、提示和通用模型的兴起，「零样本」学习正在获得关注。与此同时，「小样本」学习比去年有所下降。然而，就原始数字而言，至少目前而言，「小样本」（45）比「零样本」（35）略有优势。

模态

2023年，多模态和跨模态应用加速发展。

边界模糊

虽然传统计算机视觉关键词如「图像」和「视频」的频率相对保持不变，但「文本」/「语言」和「音频」出现的频率更高。

即使「多模态」这个词本身没有在论文标题中出现，也很难否认计算机视觉正在走向多模态的未来。

这在视觉-语言任务中尤其明显，正如「开放」、「提示」和「词汇」的急剧上升所表明的那样。

这种情况最极端的例子是「开放词汇」这个复合词，它在2022年只出现了3次，但在2023年出现了18次。

深入挖掘CVPR 2023论文标题中的关键词

点云9

三维计算机视觉应用正在从以二维图像推断3D信息（「深度」和「立体」）转向直接在3D点云数据上进行工作的计算机视觉系统。

如果不将ChatGPT纳入其中，2023年任何与机器学习相关的全面报道都是不完整的。我们决定让事情变得有趣，并使用ChatGPT来寻找CVPR 2023中最有创意的标题。

对于每一篇上传到Arxiv的论文，我们抓取了摘要，并要求 ChatGPT （GPT-3.5 API）为相应的CVPR论文生成一个标题。

然后，我们将这些由ChatGPT生成的标题和实际的论文标题，使用OpenAI的text-embedding-ada-002模型生成嵌入向量，并计算ChatGPT生成的标题和作者生成的标题之间的余弦相似度。

这可以告诉我们什么？ChatGPT越接近实际的论文标题，这个标题就越可预测。换句话说，ChatGPT的预测越「偏」，作者给论文命名的「创造性」就越强。

嵌入和余弦相似度为我们提供了一个有趣的，尽管远非完美的，量化方法。

我们按照这个指标对论文进行了排序。话不多说，下面是最具创造性的标题:

实际的标题：Tracking Every Thing in the Wild

预测的标题：Disentangling Classification from Tracking: Introducing TETA for Comprehensive Benchmarking of Multi-Category Multiple Object Tracking

实际的标题：Learning to Bootstrap for Combating Label Noise

预测的标题：Learnable Loss Objective for Joint Instance and Label Reweighting in Deep Neural Networks

实际的标题：Seeing a Rose in Five Thousand Ways

预测的标题：Learning Object Intrinsics from Single Internet Images for Superior Visual Rendering and Synthesis

实际的标题：Why is the winner the best?

预测的标题：Analyzing Winning Strategies in International Benchmarking Competitions for Image Analysis: Insights from a Multi-Center Study of IEEE ISBI and MICCAI 2021

https://voxel51.com/blog/cvpr-2023-and-the-state-of-computer-vision/

标签：

旌晶食品开展健康科普宣传活动落实国民营养计划

2022-05-23查看详情

山东青岛：楼宇经济体劳动争议预防调解联盟成立

2022-02-15查看详情

电力巡线工“偏向虎山行”

2022-02-15查看详情

世界聚焦：CVPR2023论文总结！CV最热领域颁给多模态、扩散模型

模型

任务

模态

世界聚焦：CVPR2023论文总结！CV最热领域颁给多模态、扩散模型

【独家焦点】G企孵化-千趣生活项目，10年互联网经验专业策划商业模式

总投资约12亿！内江又一潮流商业街区“呼之欲出”——

哥伦布发现新大陆的时间是_哥伦布发现新大陆的时间 世界最资讯

合众思壮连续四年财务造假 律师：已有三类涉“专网通信”索赔案件|环球视讯

【小新的vlog】在上海张江机器人谷看“才艺秀” 天天通讯

阳新布贴艺术节“点燃”非遗“火花”-世界热推荐

全球看热讯：借款软件哪些容易通过 容易通过的借款软件盘点

手风琴左手贝司指法 手风琴左手入门

全球聚焦：2023成都高新区新能源购车补贴指定车企+电话

制止餐饮浪费！ 今年以来广东立案查处餐饮浪费案件341件-全球焦点

最好养的花草有哪些品种？分享公认好养的7种花，就算阳光不足，也能年年生长、开花 全球热推荐

焦点速递！车联网先行者的“十年”

南宁糖业（000911）5月22日13点10分触及涨停板

青岛银行连续六年获中国人民银行公开市场业务一级交易商资格

全球观热点：人力资源管理基础知识培训（人力资源管理基础知识）

英超综合：曼城小胜切尔西 布莱顿锁定欧战资格

竹西街道：春风和你一起young——邗江区青年联谊派对成功举办

大连人VS浙江又是6分战！谢晖用好中场不留遗憾 穆谢奎教曼佐基射门 当前动态

影响我国国家安全，停止采购！

我国加快推进节粮减损 耕好“无形良田”

热资讯！假面骑士Geats：MK9形态变身机制公开，也是使用MK3带扣

今日热门!皇马瓦伦爆发大规模冲突 维尼修斯报复打人遭直红罚下

安全用妆共治共享 大庆启动化妆品安全科普宣传周活动 天天播报

CCTV5直播世乒赛：4-1横扫日本伊藤美诚，世界第四王艺迪4-0强势冲冠_全球热消息

lol肉装符文（lol肉符文）

全球信息:已有儿女的农民夫妻捡脑瘫女婴照顾28年

外交部副部长召见日本驻华大使具体详细内容是什么

传承川剧艺术，“6朵梅花”齐聚川剧文生名家名戏专场|世界即时看

快报：圆满落幕丨破风前行！88公里争夺战，蒙古小将勇夺冠军！

中华企业1-4月实现签约金额49.3亿元 同比增加12.62%_世界最新

全新雅阁上市，PHEV版亮相

女高中生情书火了，内容过于浪漫，班主任：学习能这么上心多好 世界最新

焦点播报:【教程】饥荒联机版（本地服务器+内网穿透）部分问题解决办法

当前最新：职业高中的真实生活_职业高中

全球即时看！鲜嫩正当季，这个时令蔬菜正批量上市

当前速看：怀孕前三个月注意事项和饮食禁忌_怀孕前三个月可以吃虾吗

《色彩分析仪测评方法》团体标准正式发布 开创精密检测崭新未来|全球快播 全球热门

全民营养周：老年人如何才能吃出健康 视讯

申不安床是什么意思_安床是什么意思|热门

铰刀规格型号标准_铰刀规格型号

环球观点：乔纳森·亨德利建筑师事务所的红色海滩小屋屹立在前厕所的顶楼

世界微速讯：d+a是什么（d a）

全球今热点：斗罗大陆：四块魂骨都有归属，比比东想拉拢唐三

【世界新视野】不管约不约会，都要穿得舒服又漂亮！

环球快资讯：视频｜前方高甜！山东这个村葡萄丰收了，快来尝鲜！

头条焦点：郭士强：广州老板对我百分百信任 压力再大自己都没问题

跆拳道奥运冠军郑姝音为温州学子上了一堂公开课

“520”也有别样的爱，普陀这里爱意满满暖人心

俄罗斯禁止包括奥巴马在内的500名美国人入境_今日视点

成本会计岗位职责怎么写_成本会计岗位职责

婚姻登记条件有哪些 当前最新

刚刚，王健林万达集团紧急声明！ 环球快讯

word怎么插入分节符号-word怎么插入分节符

哈登！火箭

西洽会看变化：一辆汽车的绿色、智能升级之路-每日短讯

【世界报资讯】齐齐哈尔：民营经济活力四射

柯妮丝项链_柯妮丝

再升科技（603601）：5月19日北向资金增持50.61万股

全球要闻：北方有大风沙尘南方新一轮降雨来袭 多地体感由夏返春

塔罗师证书国家承认吗 塔罗师证书|观热点

每日速读!二次元三次元是什么意思_二次元三次元分别代表什么

全球速读：瓯海供电分局：深化政企联动 全力筑牢电力安全“防火墙”

柳州海事局连续处置两起水上险情 成功救起2名落水人员

投资建议未有合理依据！华西证券一营业部被采取行政监管措施

人最多感染8次新冠？专家：毫无依据，再感染普遍症状轻|世界新要闻

滦平县气象台发布大风蓝色预警[Ⅳ级/一般] 【2023-05-19】|全球最资讯

5月19日国内黄金期货跌0.32% 全球速看

通胀加速又如何 日本央行行长植田和男再放鸽：不会过早改变政策

对话吴钩：泸县宋代石刻是一部展现宋代生活的“纪录片”

欣天科技：截止至2023年5月10日，公司股东总户数为17,041户

山火影响能源生产 加拿大对美国天然气出口创两年来新低 当前热文

拥有500年历史的北京平谷丫髻山庙会开幕

量子计算取得革命性突破！Google Quantum AI发现编织非阿贝尔任意子_焦点报道

天天通讯！《鬼怪传说》游戏武器有哪些？游戏武器特点分享

头条焦点：空、天、地协同，为农场黑土地做“体检”

哥伦布发现新大陆的时间是_哥伦布发现新大陆的时间世界最资讯

合众思壮连续四年财务造假律师：已有三类涉“专网通信”索赔案件|环球视讯

全球看热讯：借款软件哪些容易通过容易通过的借款软件盘点

手风琴左手贝司指法手风琴左手入门

制止餐饮浪费！今年以来广东立案查处餐饮浪费案件341件-全球焦点

最好养的花草有哪些品种？分享公认好养的7种花，就算阳光不足，也能年年生长、开花全球热推荐

英超综合：曼城小胜切尔西布莱顿锁定欧战资格

大连人VS浙江又是6分战！谢晖用好中场不留遗憾穆谢奎教曼佐基射门当前动态

我国加快推进节粮减损耕好“无形良田”

今日热门!皇马瓦伦爆发大规模冲突维尼修斯报复打人遭直红罚下

安全用妆共治共享大庆启动化妆品安全科普宣传周活动天天播报

中华企业1-4月实现签约金额49.3亿元同比增加12.62%_世界最新

女高中生情书火了，内容过于浪漫，班主任：学习能这么上心多好世界最新

《色彩分析仪测评方法》团体标准正式发布开创精密检测崭新未来|全球快播全球热门

全民营养周：老年人如何才能吃出健康视讯

头条焦点：郭士强：广州老板对我百分百信任压力再大自己都没问题

婚姻登记条件有哪些当前最新

刚刚，王健林万达集团紧急声明！环球快讯

全球要闻：北方有大风沙尘南方新一轮降雨来袭多地体感由夏返春

塔罗师证书国家承认吗塔罗师证书|观热点

全球速读：瓯海供电分局：深化政企联动全力筑牢电力安全“防火墙”

柳州海事局连续处置两起水上险情成功救起2名落水人员

通胀加速又如何日本央行行长植田和男再放鸽：不会过早改变政策

山火影响能源生产加拿大对美国天然气出口创两年来新低当前热文

俗话说皇帝的女儿不愁嫁唐朝时期的公主为何会“恶名远播”

丰泽：2023年优秀年轻干部培训班开班当前快播

雅漾喷雾成分（雅漾喷雾成分表）世界实时

世界即时看！“智行天下能动未来” 第七届世界智能大会在天津开幕（组图）

天天消息！今日50股涨停主要集中在通信、电子等行业

湖南电台: 湖南红太阳新能源打开"光"照世界双通道|每日看点

微软(MSFT.US)CEO分享对AI担忧称社会必须团结一致_全球滚动

大师联手《唐·帕斯夸莱》《丑角》将演短讯

国台办：民进党当局才是台海和平稳定真正威胁环球今日报

郑州市妇联组织干部职工走进国脉非遗传习馆感悟体验非遗文化|快播

动态：《温柔壳》曝终极海报王子文尹昉海边甜蜜牵手

贵州麻江蓝莓开始采摘世界通讯

2023年电子行业中期投资策略 AI服务器提供增量市场每日快讯

【一线讲述】为祁连山生态环境贡献巾帼力量天天看热讯

工厂车间节能降耗合理化建议节能降耗合理化建议

丙烯酸乳液分几种丙烯酸乳液成分是什么

市州观察丨助力民营经济轻装上阵南充当好经营主体的“店小二”和“护航员”

快看：甘肃兰州新区中川园区市场监管局设立流动审批服务窗口助推地摊夜市经济发展

大理市：乡音颂党恩理论进万家_世界百事通