首页 抖音热门文章正文

为什么人工智能现在不知道一篇幽默文章的笑点在哪里?

抖音热门 2025年10月05日 02:43 1 cc
为什么人工智能现在不知道一篇幽默文章的笑点在哪里?

在人工智能以极限的速度攻克人类智力堡垒的今天,大型语言模型(LLM)已经能够通过法学院入学考试、编写复杂的计算机代码,甚至进行哲学辩论。然而,一个简单的人类互动——理解并欣赏一则笑话——却依然是亘古横在机器智能面前的鸿沟。还有比《纽约客》杂志著名的漫画配文大赛更能凸显这种根本性差距。这个每周吸引数万读者参与的文化现象,正意外地成为日常通用人工智能(AGI)进展的保险“图灵测试”,其结果揭示了当前人工智能的内在创伤:机器能够计算,但尚未真正理解。

解构笑点:从“失谐理论”到计算的鸿沟

长期担任《纽约客》漫画编辑的鲍勃·曼科夫(Bob) Mankoff)最近进行的一个实验,精准地抓住了问题的核心。他向多个顶级AI模型展示了一幅漫画:一个小丑车的发动机盖被打开,里面没有发动机,而是挤着三名小丑和一款西装履革的移植。模型们反复将笑点定位于“小丑”,这个相似的元素。只有一个模型最终实现了幽默的本质——真正的笑点相当于格格不入的移植。正如周的获奖配文所言:“我在引擎盖下发现了点的东西。”

这个例子完美地诠释了幽默心理学中的核心理论之一:“失谐-解困理论”(Incongruity-Resolution)该理论认为,幽默产生于两个阶段:首先,我们认识到一个与预期严重不符的“失谐”构成;其次,通过我们巧妙的转折或解释,为这种不协调了一个出人意料却又合乎逻辑的“解困”方案。作品的空间,却受到人类角色的热烈关注,尤其是与小丑的奇幻、荒诞风格形成曝光对比的移植。“解困”则由配文提供,它用“严肃”进行,双关地指代了移植的举止和潜在的“严重”机械问题,从而在一个新的认知框架下解决了这种不协调,引发了笑声。

这是人工智能面临的根本性挑战。理解这个知识库,需要的远远不止是图像识别和文本关联。它要求模型具备一个庞大且可执行的“世界模型”或常识知识库:

  1. 加密知识:理解修车厂是修理机械的地方,汽车发动机盖下应该是什么。
  2. 文化脚本:掌握关于“抑制”和“重建”的文化刻板印象。抑制代表滑稽、扰乱和非理性;抑制则代表沉默、秩序和理性。
  3. 推理能力:识别出移植的出现是对整个“小丑车”场景逻辑的根本性破坏,是“失谐”中的“失谐”。
  4. 语言歧义性:理解解析配文中“严肃”执行的双重意义,将其与图像中的线索视觉精准匹配。

当前的大型语言模型虽然在海量数据中学习了模式,但它们缺乏一个连贯、统一的现实世界模型。它们通过统计关联来“编辑”理解,并不是真正基于常识进行推理。因此,它们能够轻易识别出“消灭”这一突出特征,但却难以捕捉到那种定义了人类幽默的、微妙的结构性矛盾。

作为数据集的漫画:当大数据满足人类的价值

由曼科夫于1998年发表的专辑配文大赛,经过二十多年的积累,已经形成了一个对计算机科学家吸引力漫画的数据集。数千幅、对应数百万条由人类创作的配文,以及经过编辑和读者投票筛选出的“最佳”答案。这为评估人工智能的幽默能力提供了一个参考的基准。然而,它也暴露了将人类优越性数据化的巨大困难。

与数学题或逻辑题唯一正确答案不同,幽默的评判标准是高度重视、多变且依赖文化背景的。一条配文可能让一部分人受挫,但却让另一部分人觉得平淡无奇。如何为这种“模糊”的数据标签标签,成为机器学习面临的危机存在的问题。

为了应对这一挑战,研究人员,包括与曼科夫合作的计算机科学家达芙娜·沙哈夫(Dafna Shahaf)等人,正在探索更为精细的计算方法。他们不再追求让AI直接“创作”出最搞笑的配文,而是将任务划分为更可控的子问题:

  • 幽默排序:让AI模型对人类提交的配文进行排序,判断其幽默程度的高低。这比从零开始创作更容易评估,模型需要学习的,是理解幽默的相对等级。
  • 异常检测:训练AI识别出图像中最不寻常、最可能成为幽默焦点的元素。在小丑车的例子中,成功的模型应该能识别出“移植”是比“小丑”更关键的异常点。
  • 语义距离分析:优秀的配文往往与图像内容保持一种解决的“语义距离”——既相关,又不是简单的字面描述,同时还附带了一种补充的转折。研究人员试图通过计算文本和图像元素之间的语义关联,来找到一条“最佳幽默曲线”。

尽管取得了部分进展,但这些方法仍然停留在模式识别的层面。它们可以帮助AI筛选出“看起来像”笑话的配文,但无法保证AI真正“理解”了笑话的内在逻辑和文化内涵。

超越修改:通用人工智能的“幽蒙感”意味着什么?

达芙娜·沙哈夫将幽默称为通向通用人工智能的“最后边界”,这一观点深刻地指出了幽默感对于智能的意义。一个真正具备幽默感的AI,将不仅仅是一个会讲笑话的程序,它必然是一个拥有高度发达的认知能力的系统。这种至少包括:

  • 强大的常识推理:拥有一个动态的、灵活的世界模型,能够理解物理规律、社会规范和人类行为的复杂相互作用。
  • 心智理论(Theory of Mind):能够推断他人的意图、信念和情感状态,从而达到讽刺、反语和自嘲等高级幽默形式。
  • 概念联想:能够在梳理关联的概念之间建立新颖、有趣且有意义的联系,这是所有原创幽默的基础。

从这个意义上来说,攻克幽默问题,其目标并不是为了给人工智能增添娱乐功能,而是因为幽默感是一个智能体,是否真正理解我们这个复杂、不一致的杠杆逻辑的世界黄金标准。一个能够稳定地理解并版权出《纽约客》级别幽默的系统,几乎肯定已经可以侵占从专用人工智能到通用人工智能的权限。

因此,当鲍勃·曼科夫,这位曾经的实验心理学博士生,如今以漫画编辑的身份投身于计算幽默研究时,他不仅仅是在完成个人年轻时未竟的学术心愿。他和他的科学家同事们,正在用一种最优雅、最丰富的人文氛围的方式,探索着人工智能最核心的难题。提出的问题——“机器何时才能笑?”——实际上是在问:“机器何时才能真正思考开始?”

发表评论

德业号 网站地图 Copyright © 2013-2024 德业号. All Rights Reserved.