首页 十大品牌文章正文

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

十大品牌 2025年10月11日 16:04 1 cc

YannLeCun这波是真没让人失望,之前还传他可能要从Meta辞职,加上Meta一直被审核规定折腾得够呛,本以为他的科研节奏得慢下来,结果人家直接带着最新论文冲了出来,还是和三位FAIR的同事一起搞的。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

这次研究最关键的发现,说出来你可能会惊讶,自监督模型JEPAs居然藏着个“隐藏技能”,它居然学会认数据的“密度”了。说白了就是能分清哪些数据常见,哪些少见,甚至是异常的。本来学界都觉得JEPAs就只会提取特征,跟数据密度没啥关系,这下直接把这个老观点给推翻了。

要搞懂这个突破到底有多重要,得先说说JEPAs是啥,这是LeCun团队近几年重点推的自监督学习框架,最大的好处就是不用人手动给数据标标签,模型自己就能从海量数据里学规律,学完了就能直接用在图像识别、跨模态匹配这些下游任务上,在AI圈里算是高效学习的代表。老实讲,之前我也觉得这模型就是个“特征提取器”,没多想它还能搞别的,结果这次研究还真给了个大惊喜。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

反坍缩藏“彩蛋”:JEPAs学数据密度不是巧合

之前大家都知道JEPAs训练有两个核心目标,其中一个就是“反坍缩”,啥是反坍缩,要是所有数据的特征都变得一模一样,那模型等于白学一场,反坍缩就是防止出现这种情况,保证特征有用。本来想简单说这就是个“防出错”的功能,但后来发现这么说太浅了,LeCun团队盯着反坍缩的价值深挖,用变量替换公式和高维统计特性推导,最后证明反坍缩不光能防特征坍缩,还能让JEPAs精准学数据密度。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

说实话,之前有些AI模型训练时就容易出特征坍缩的问题,比如早期的ViT模型在小数据集上练,特征就容易变得差不多,跟把各种颜色混成灰色似的,只能靠加正则化项解决,效果还一般。现在JEPAs靠反坍缩不仅解决了这问题,还顺带学了数据密度,这就相当于一举两得。我觉得这挺有意思的,搞科研有时候就像挖宝藏,本来冲着一个目标去,结果在旁边又发现了新宝贝。

而且从理论上看,这还不是偶然,当JEPAs输出高斯嵌入(就是高维空间里像在超球面上均匀分布的特征)时,必须靠雅可比矩阵感知数据密度,才能满足训练的约束条件。这么看来,JEPAs学数据密度是必然的,之前没发现只是大家没往这方面想而已。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

光在理论上证明了还不够,得有个能落地用的工具才行,不然这“隐藏技能”再厉害也没法发挥作用。所以LeCun团队又搞出了JEPA-SCORE,这东西就是从JEPAs里提取数据密度的量化指标,核心作用就是给样本的常见度打分。

JEPA-SCORE太“百搭”:啥数据啥模型都能hold住

JEPA-SCORE的计算逻辑其实不复杂,就是拿JEPAs处理样本时的雅可比矩阵,算出矩阵的特征值,再取对数求和,结果就是JEPA-SCORE。分数高的就是常见样本,分数低的就是少见或异常的。本来我还担心计算会不会很麻烦,得调一堆参数,结果发现挺简洁高效的,不用额外费功夫。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

更厉害的是这工具还特“百搭”,不管啥数据集都能用,像ImageNet、手写数字MNIST,甚至是没参与过预训练的星云图集,它都能精准计算。而且不管是I-JEPA、DINOv2这种单模态视觉模型,还是MetaCLIP这种多模态模型,只要是训练好的JEPAs家族模型,都能直接用,不用再额外训模型。

老实讲,这一点太圈粉了,有些工具挑数据集挑模型,换个场景就得重新调,用着特别费劲,JEPA-SCORE就没这毛病。之前我查过,传统的datadensity量化工具比如核密度估计KDE,在大数据集上算得挺慢的,JEPA-SCORE比它快不少,这在实际应用里太重要了,要是处理个数据得等半天,效率就太低了。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

当然,光说好用不算数,得有实验证明才行,不然就是空口说白话,团队搞了好几组实验,结果都挺能打的。在ImageNet数据集里,不同的JEPAs模型对常见的飞行鸟类样本和少见的栖息鸟类样本,JEPA-SCORE的判定都差不多,说明这是JEPAs的共性能力,不是某个模型碰巧做到的。

面对没参与过预训练的星系图像数据集,JEPA-SCORE的分数明显比ImageNet低,说明模型能精准认出陌生数据。而且在数据筛选和异常检测的实用测试里,它的效果也比传统方法好。说实话,这就让我觉得这研究不是停留在纸面上,是真的能用到实际场景里的,比如以后用来筛数据、找异常,都能省不少事。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

这次研究也不是LeCun一个人的功劳,另外三位核心研究者都是MetaFAIR的人,个个都有两把刷子。RandallBalestriero是布朗大学的计算机科学助理教授,从2013年就研究可学习信号处理,他参与的技术还用过在NASA火星车的火星地震探测上;NicolasBallas有法国格勒诺布尔大学的博士学位,2017年就进了FAIR当研究科学家,现在都待了八年多了。

MichaelRabbat是FAIR的创始成员,学历背景也硬,研究方向聚焦优化算法、分布式算法和信号处理,之前还在麦吉尔大学当教授。看这团队配置就知道,能出这成果不是偶然,每个人都有自己擅长的领域,凑在一起就能从不同角度发力,把研究做深做透。有时候搞技术就是这样,单靠一个人很难有大突破,团队的互补太重要了。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

总的来说,这次LeCun团队的研究不光打破了学界对JEPAs的传统认知,还给出了JEPA-SCORE这么实用的工具,而且有扎实的实验和强大的团队背书,可信度很高。更难得的是,在Meta受审核规定“折磨”的情况下,FAIR团队还能保持这样的科研节奏,拿出这么有价值的成果,这份韧性挺让人佩服的。

JEPAs不只是学特征!LeCun团队揪出隐藏技能,其适配所有数据

以后这技术要是用在医疗影像异常检测、自动驾驶数据清洗这些地方,应该能发挥不少作用,我还挺期待后续他们能再挖挖JEPAs的其他“隐藏技能”的,毕竟这次能发现学数据密度,保不齐下次还有新惊喜呢。

发表评论

德业号 网站地图 Copyright © 2013-2024 德业号. All Rights Reserved.