admin 百科大全 2023-02-26 21:11:48

SparK项目原作解读：卷积模型的首个BERT预训练

「大规模预训练」是 AI 各领域愈发浮出水面的宏图愿景。BERT 预训练与 GPT 齐名，分别被证明在语言理解和语言生成下游任务上取得了卓越性能，是 NLP 表征学习的利器。「卷积模型」则是视觉领域的中流砥柱。得益于高度并行化和局部化，CNN 长期积累的硬件优化使其成为现实工业界中不可代替的骨干。「强大的预训练的卷积模型」则是视觉研究者的长期追求，然而，卷积模型的 SOTA 预训练仍停滞在对比学习，将 BERT 的成功从 Transformer 迁移到卷积是一个吸引人但未实现的愿景。

SparK 工作初步进行了一些探索：该工作归纳 BERT 算法和 CNN 模型的关键不适配在于两点：(1) 是规整的 CNN 天生无法处理随机的、不规则的 BERT 随机掩码的输入，(2) 是视觉领域中长期以来的 “多尺度” 设计，与天然单尺度的 BERT 存在不一致。其解决方案是：(1) 使用子流形稀疏卷积以适应随机孔洞输入，(2) 设计 UNet 风格结构以允许多尺度信息的流通。

作为卷积模型上的首个 BERT 式预训练，SparK 可被使用在任何模型上，并以 ResNet 系列和 ConvNeXt 为例测试，性能远超有监督预训练、对比学习，甚至超过 MIM+Swin-Transformer. 目前代码、模型均开源，作者希望能够为真实场景下的卷积模型助力，并帮助探索更广阔的视觉预训练领域。

机器之心最新一期线上分享邀请到了北京大学在读硕士田柯宇，为大家分享他们近期工作 SparK。

分享主题：SparK：卷积模型的首个BERT预训练

分享嘉宾：田柯宇，北京大学研一学生，导师为王立威老师，研究方向为深度学习算法，包括超参数优化/强化学习/自监督的新型算法，在 NeurIPS 等会议发表多篇论文并担任 NeurIPS/ICML/ICLR/CVPR 等审稿人。

分享摘要：SparK 由北大与字节跳动合作，是卷积模型上的首个通用的 BERT 式预训练，可被运用在任何卷积网络上（如 ResNet-50/ConvNeXt）。在分类 / 检测 / 分割的标准下游场景，SparK 大幅超过了有监督预训练和对比学习（最高涨幅达 3.5），超越 MIM+Swin-Transformer，并展现出可扩放性质（scalable）：大模型收益更多。希望 SparK 的开源，以及其利用稀疏卷积和多尺度结构的两个关键设计，可以助力使用卷积网络的各个真实场景、贡献社区。

相关链接：

1）SOTA！模型平台项目主页链接：

/project/spark

2）论文链接：

/abs/2301.03580

3）代码仓库：

https://github.com/keyu-tian/SparK

4）Demo视频：

/watch?v=-IWyQ2hAoBw

机器之心 · 机动组机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。
本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

DABAN RP主题是一个优秀的主题，极致后台体验，无插件，集成会员系统
白度搜_经验知识百科全书 » SparK项目原作解读：卷积模型的首个BERT预训练

admin 管理员组

分享到：

SparK项目原作解读：卷积模型的首个BERT预训练

admin 管理员组

0条评论

发表评论取消回复

admin 管理员组

相关推荐

0条评论

发表评论 取消回复

提供最优质的资源集合

发表评论取消回复