对比蚂蚁与人类在协作式几何难题求解中的表现
由 Marcus Feldman(美国斯坦福大学)编辑;于 2024 年 7 月 17 日收到稿件,2024 年 11 月 11 日接收
2024 年 12 月 23 日
第 122 卷(第 1 期) e2414274121
重要意义(Significance)
群居生活常被认为能带来“群体智慧”,但究竟哪些因素真正促进群体变得更聪明?为回答此问题,我们比较了蚂蚁个体与群体、人类个体与群体在同一道几何谜题上的解题表现。结果发现,蚂蚁在群体协作时,表现显著提升;而人类群体并未出现同样的显著提升,甚至在交流受限时,表现还会下降。为何会产生这种差异?蚂蚁的简单性使得单个个体无法独立完成这个谜题,但也正是这种简单性促使牠们能更有效地与巢友合作。而人类个体的认知相对复杂,能高效地独立解题,但不同个人之间的差异却阻碍了群体效率的最大化。
摘要(Abstract)
生物群体往往利用集体智慧共同应对挑战,但若协调不佳则会削弱群体认知的效能。要检验集体认知是否超过个体认知,往往并不容易,因为不同组织层级通常面临的是不同的问题。而“将大型物体穿越复杂环境并运送至目标位置”的难题却是一个例外:无论是蚂蚁还是人类,都擅长单独或协同完成这一任务。这样一来,我们得以在跨物种、跨群体规模的层面上,将解题能力及认知特点进行少见的直接对比。在本研究中,我们让人类和蚂蚁同时面对同一个“搬钢琴(piano-movers)”式的大型负载搬运谜题。结果发现:蚂蚁群体规模越大,搬运效率越高;而人类则恰恰相反。进一步发现,单只蚂蚁虽无法理解谜题的整体结构,但牠们的集体运动却能形成新颖的涌现认知技能:通过集体排列的有序状态来短期记忆移动方向,从而提升群体的解题能力。相比之下,人类对谜题有更清晰的全局认知,因此能够减少搜寻空间,平均表现优于蚂蚁。然而,一旦限制了人类之间的交流,人类群体就会退而采取最显而易见的动作以达到共识,这种做法颇似蚂蚁的行为模式,却对解题效率产生负面影响。我们的研究说明:简单大脑的个体更易在群体中实现能力可伸缩性,而复杂大脑则需要充分而复杂的交流才能在合作中保持高效。
群居生活有诸多优势,“集体认知”正是其中最令人好奇的一种(1–4)。在 Shettleworth 的定义下(6, 7),当群体可以对环境信息进行感知(8–11)、整合(12–15)及相应地作出反应(16, 17),那么这种“群体共同认知”(5)就满足了 Shettleworth 对于认知的基本要求。将这种感知、整合、应答能力加以提升,能够让一个合作群体的认知水平超越其个体成员(5)。但另一方面,由于大型群体的协调难度很大,群体努力往往会适得其反(18–21)。虽然我们很容易想到要将个体与整个群体的认知能力进行对比,但由于不同群体规模通常会在不同的时空尺度与环境交互,很多情况下无法做出有意义的比较。例如,我们没法把单个神经元与整个大脑的认知水平进行对比。尽管文献中已经确认了很多“群体”层面才会出现的新认知能力(8, 22),但在实践中,能直接、定量地将单体与群体的认知进行对比的实例仍然很少见(23–27)。
在能够协作搬运物体的物种中,出现了一个独特的场景,可为跨尺度生物对比提供宝贵的契机:这些物种会由个体拖动小负载,而由群体携手搬运大负载。很明显,多数带来更强的肌肉力量。不过,如果群体协作还能带来额外的认知增益,那么在地形阻碍复杂的环境中,这种认知会显著提升搬运效率(10)。若想量化验证这种认知增强,可以通过设计物理谜题(28, 29),并以适当的方式对其进行缩放,使其既能够挑战单个个体,也可以挑战大型群体。在我们的工作中,我们使用了所谓的“搬钢琴”难题(30, 31),即需要在一个狭窄而且有障碍的环境里运输一个形状复杂的负载。由于这是一个纯粹的几何问题,我们可以灵活地调节它的大小:让它足够小,单个个体就能应对;也可加大尺寸,让必须通过一个大型群体的通力合作才能搬得动。在大自然中,能进行如此大规模物体协作搬运的例子极少,目前仅见于人类与极少数蚂蚁物种(3, 32, 33)。因此,我们让人类与长角疯蚁(Paratrechina longicornis)分别以个体和不同规模群体的方式,尝试解开这个搬钢琴难题。
同一道谜题,多种解题主体
我们设计了一个 T 形负载,需要在长方形的三段式场地(由两个狭窄的通道连接)中搬运(图 1A 和 B)。要想成功解题,需将负载从最左侧区域(图 1C 中的 )一路穿越到第二个区域,再进到第三个与外界相通的区域(图 1C 中的 )。其“最优解”(无多余动作)可以按 图 1C 中绿色箭头所示的动作序列来实现。
图 1.
搬钢琴谜题。(A)展示了两个不同蚂蚁解题场景的快照:单只蚂蚁(左)和一个大型蚂蚁群(右)在解题过程中的画面;其中对叠加的搬运蚂蚁做了局部放大。负载在迷宫中的位置可通过质心坐标 以及转动角度 来描述。(B)展示了两个不同人类解题场景的快照:单个人(左)和一大群人(右)在尝试解题时的画面。面板 A 和 B 中的红色突出显示了负载。(C)负载在谜题中的可能状态,每个状态对应状态空间中的一个“子体积”,并以匹配的颜色表示。实线和虚线分别表示在状态空间中连通与不连通(但几何上相邻)的状态。绿色实线和箭头表示最优解的状态转移序列。(D)从两个不同视角说明了三维状态空间中各分区对应于面板 C 中不同颜色状态。上方视角展示了(或 )处的二维切片,其对应的负载示意图属于状态 。下方黑色轨迹线是在该状态空间中跟随最优解的移动路径。
我们将该谜题按照比例缩放,分别让人类和蚂蚁来尝试解决(图 1A 和 B)。对于人类而言,是带着任务指令去解题;而蚂蚁则是因为食物驱动——第三个区域对蚂蚁巢穴是开放的,我们把负载处理成类似“食物”的样子。该谜题对两个物种而言都构成了较大挑战:人类需要面对精确的长度衡量、脑中旋转以及对称性的理解(附录图 S1A–C,以及参考 34, 35),以分辨可行通路和死胡同;蚂蚁则因牠们主要依靠信息素传播导航指令,但信息素并不包含负载大小与门口大小的关系,也无法传递旋转信息(36),导致其常用的“信息素导航策略”在这里派不上用场。
为对比跨物种和群体规模的解题表现,我们把该谜题制作了五种不同尺寸(附录图 S2C–H)。蚂蚁要面对两种尺寸:“小号”对应单只蚂蚁(个复合实验,见“材料与方法”)或由约只蚂蚁组成的小群体();“大号”则由约只蚂蚁( )合作完成。对于人类,则有三种不同尺寸:由单个人()解“小号”,由 6–9 人解“中号”,由 16–26 人解“大号”。图 1A 和 B 中可以看到若干解题过程的快照;具体解题录影可见 Movie S1–S5。
Movie S1.
单只蚂蚁依次解题的画面(播放速度加快 10 倍,并裁切掉了长时间无负载运动的部分),场地地面上红点间隔 2 cm。
Movie S2.
一个小型蚂蚁群解题的录影(播放速度加快 10 倍),地面上红点间隔 2 cm。
Movie S3.
一个大型蚂蚁群解题的录影(播放速度加快 10 倍),地面上红点间隔 2 cm。
Movie S4.
单个人解题的录影(播放速度加快 10 倍)。
Movie S5.
一个大型、交流受限的人群解题的录影(播放速度加快 10 倍)。
为了尽量模拟蚂蚁的搬运行为,人类与蚂蚁谜题均保持了身体尺寸与负载尺寸间相仿的比例。受蚂蚁“只在附着点进行拉拽”这种搬运方式的启发(37),我们给每位参与的大号人群成员都分配了一个与负载相连的“把手”,并要求他们只通过拉拽该把手来施力。而且,在大号负载的各把手上装有测力计,可全程记录每位参与者的拉力。
此外,人类群体还被分为两类实验组:允许自由交流(中号: ,大号: )和高度限制交流(中号: ,大号: )。在后者情形下,参与者不得言语或做手势,并需戴口罩与墨镜遮住口部和眼睛。如此一来,受限交流的人群在搬运中只能主要依靠负载传递的力信号进行沟通,这与蚂蚁的情况类似(对长角疯蚁而言,其合作搬运时使用的触觉与信息素信息都很重要(38; 36),可是在本谜题中,信息素基本无用,故主要只剩下基于拉力的沟通)。因此,对蚂蚁群与受限交流的人群进行对比具有重要意义。
在下文中,我们将上述 8 组解题主体称作 8 种“解题者”(solver)(5)。
测量解题者的表现
解题过程中,负载的运动学可用其三个自由度( )随时间的变化来描述,其中 表示负载质心的位置, 表示负载转动角度(见图 1A)。由于旋转角度 是一个循环坐标,我们将其乘以负载外围平均半径 (见附录表 S1 和 S2)来得到转动运动对应的线性位移,从而令 表征一个附着在负载外围的搬运者在该旋转过程中的平均位移。为方便跨不同尺寸对比,我们又将 再除以第二个房间的宽度(图 1A)。如图 1D所示,整个负载在过程中的可行配置构成了“状态空间”,解题过程的运动轨迹可视为该状态空间中的一条连续路径。为分析解题轨迹,我们又把此状态空间进一步划分为图 1C中所示的更小“状态”。
我们对每种解题者的整体表现进行度量,其方法是:考察成功解题的累积分布,即,当某条解题轨迹的在状态空间中的归一化总路程(图 2A)或在尝试过的状态转移次数(图 2B)不超过某个阈值时,能成功解题的轨迹所占比例。结果表明,在整体上,人类解题者平均表现优于蚂蚁解题者(图 2A),但从分布的角度看,表现最好的蚂蚁也能胜过表现最差的人类。
图 2.
不同解题者的表现。(A)展示了蚂蚁和人类(含实验与模拟)的成功解题在路线总长维度的累积分布函数。(B)展示了单个人与多人组(有自由交流或受限交流)的成功解题在尝试的状态转移次数维度的累积分布函数。由于对于中号与大号人群而言,它们相对单个人的表现都差不多(见附录图 S4B),所以在此为了清晰度将两类人群合并。两张图中的累积分布曲线均用移动平均法平滑,窗口大小分别为可量测的最大路线长度或最大尝试次数的 1/10。虚线表示在最优解中所需的最短路径或最少状态转移次数。
我们发现,大型蚂蚁群的表现显著优于单只或小群蚂蚁。虽然单只蚂蚁的数据相对稀少,但足以证明单只蚂蚁确实能通过一连串连续的搬运动作完成解题,只不过远不如大型蚂蚁群有效率。
在只基于负载拉力来传递信息的情境下,人类并不像蚂蚁那样因群体变大而效率更高,反而出现了负相关:交流受限的人群远不如单个人(图 2B)。允许自由交流的人群则能扭转这一局面,表现略优于个人(图 2B)。
接下来,我们将通过分析解题轨迹及力的施加动态,来探讨各类解题者的搜索策略及认知特点。
蚂蚁解题者
为理解为何大型蚂蚁群会优于小群,我们首先观察牠们在狭窄通道内的运动学表现。当一个大型群体搬运的大负载撞到墙壁时,它并不会立即停下或退回(图 3A),而是仍然维持原方向和速度的连续滑动(附录图 S5A 和 B),甚至会持续在墙面上滑行很长一段距离(图 3C)(39)。反观小负载(由小群蚂蚁搬运),在撞到墙壁后,往往明显减速(图 3B),一旦重新启动,负载方向也常大幅改变(附录图 S5A 和 B)。因此小负载要么很快就从墙边退回,要么只能在墙面上滑动很短的距离(图 3C)。先前研究也指出:群体规模越大,改变负载运动方向所需的扰动就越大(39, 40)。单只蚂蚁更是常常先从负载上脱离,然后再随机换个地方重新附着,这种行为使其难以形成大范围、持续的壁面滑动(附录图 S5G)。所以,小群蚂蚁与单只蚂蚁在局部运动特征与整体解题表现上都相似(图 2A)。
图 3.
蚂蚁解题者的运动特征与启发式策略。(A, B)分别为一个大群和一个小群在第一房间中的负载路径速度随时间的曲线,上方为实验数据,下方为模拟数据。红色阴影区表示负载与墙体接触时刻;蓝色曲线则为模拟中测得的序参量(order parameter,参见“材料与方法”)。(C)负载在与墙体接触时持续滑动距离()的概率分布,归一化后以负载长横杆相对于通道底端的距离为参照(标注于图中 G,详见附录图 S5C–F 与注释 8)。(D, E)分别为大群与小群在实验中处于状态 时的负载叠加图。上、中色块展示在进入状态 后,第一次到达某些 取值时的负载位置,下方为离开状态(回到 或前往 时)的负载位置。可见,大群在运动路径上变化更小、更具确定性;而小群的轨迹更分散。(F, G)分别为大群与小群在状态 中的示例轨迹(仅展示该状态对应的状态空间体积),其中红色与绿色标记为负载在第二个通道底部(标于 G)上开始与结束持续滑动(扫描)的位置,对应右侧的红绿负载示意图;蓝色与黄色负载示意图则表示进入与离开该状态的位置。对大群来说,负载可在墙面上持续滑动,将其“引导”至下一个通道入口,即便与出口方向并不平行;小群则缺乏这种不平行的持续滑动。
为了探究其背后的动力学机制,我们基于先前一款蚂蚁协作搬运的动力学模型(37, 38)进行了模拟。该模型给出了蚂蚁个体层面的力施加规则(见“材料与方法”):当一只蚂蚁新接触到负载时,会在大约 10 秒内充当“有信息领导者”,朝着蚁巢方向施力;此后会变成“无信息跟随者”,试图将自己的施力方向与负载在附着点的实时运动方向对齐,而且群体越大,这种对齐倾向越明显。此前研究表明,在开阔场景(无障碍物)下,这些规则会导致大负载运动呈准弹道式,而小负载则更类似于带偏向的随机游走(3, 37, 38)。在本研究中,我们将上述模型融入物理引擎(41)里,再让负载在谜题内与墙体碰撞,从而得到模拟轨迹(见材料与方法与 Movie S6, S7)。
Movie S6.
动画演示了模拟中的小群蚂蚁如何解题(播放加速 18 倍),蓝色为知情拉拽蚂蚁,绿色为无信息拉拽蚂蚁,黑色为抬举蚂蚁。每个网格大小为 1×1 cm。
Movie S7.
动画演示了模拟中的大群蚂蚁如何解题(播放加速 10 倍),蓝色为知情拉拽蚂蚁,绿色为无信息拉拽蚂蚁,黑色为抬举蚂蚁。每个网格大小为 1×1 cm。
通过模拟,我们可进一步查看蚂蚁在撞墙前后所施加的力,并量化蚂蚁们在多大程度上实现了协同一致性。为此,我们定义了一个有序度序参量:它衡量每只拉拽蚂蚁的力方向与负载在该蚂蚁附着点处的运动方向之间的夹角余弦在群体平均意义上的数值(见“材料与方法”)。模拟结果表明,大群蚂蚁在狭窄房间中能保持较高的一致性,即便与墙体碰撞后仍能持续(图 3A,以及附录注释 2)。其物理直觉是,负载没有停止而在继续运动,就会迫使搬运蚂蚁在机械上彼此耦合,进而形成高的一致性并产生在墙面上的持续滑动(图 3A, C)。而对小群来说,速度在撞墙后显著衰减(图 3B)使得蚂蚁难以保持协同一致,从而失去方向持久性(图 3B, C);实验中的衰减比模拟还要明显(图 3C),这可能是因为一些现实因素没有纳入简化模型(附录图 S3)。
在局部碰撞之外,模拟还能在整体层面上再现实验现象:大群明显优于小群(附录图 S4A)。此外,我们还进行了有限尺寸修正的模拟:在负载外缘增加一定厚度(相对于蚂蚁体长约 ),以模拟蚂蚁无法穿透负载边缘的实际情景;结果在解题表现上与实验数据达成定量一致(图 2A)。
总之,实验和模拟都支持这样的结论:大型蚂蚁群展示出的优异解题能力,源于“个体认知非常有限却能够彼此相互作用而形成新涌现行为”,而非来自单只蚂蚁的额外高阶几何思维(也与之前的实验结论36相符)。
将蚂蚁的力学特征转化成“认知语言”来讲,大群通过高持久性带来了“短期集体记忆”。这一涌现的记忆让蚂蚁群可以紧贴墙面做长距离的滑动(thigmotaxis),直至在墙上找到通道再通过(图 3C, F);相比之下,小群则更容易随机分散,或者陷入死胡同(图 3G)。在更广义的层面讲,这种记忆让大群的运动更具确定性(图 3D, E 中部的差异)并能更高效地穿越每个场地区域(可参见图 4A 前两幅蚂蚁示意图,以及附录图 S6B 的模拟结果)。
图 4.
人类解题者的运动特征与启发式策略。(A)用二维热图来表示在从状态 进入到状态 这一过程中,不同解题者在路程进度(从 0% 到 100%)时,离目标状态 的归一化距离分布。分别展示了小群蚂蚁、大群蚂蚁以及中号人群的数据。(B)展示了一名人类解题者的示例轨迹:以深度优先搜索(DFS)为例解读。虚线箭头表示在连通/不连通的两个状态节点之间尝试转移成功/失败时的移动顺序。(C)当解题者遭遇常见的 5 个决策分叉时(两条都尚未尝试过的边),选择“贪心路径”(上方示意)或“间接路径”(下方示意)的概率。上方(标注为)代表若能成功,会令负载进一步朝出口方向延伸;下方(标注为)则是需要绕远的方案。图中所示人类解题者在实验与模拟中的表现。(D)对比“允许交流”和“受限交流”的人群在开始解题时的等待时间(即真正开始移动前所花费的时间)。其中上方对应分叉中的“贪心选项”,下方对应“间接选项”。(E)在负载开始移动前后,施力者朝出口方向(红)或与之相反方向(蓝)的平均拉力大小对比。若需逆着出口方向移动(比如从死胡同退回),就必须先松开朝出口方向的拉力。对于允许交流的人群(上图),他们会先达成一致再施力;而受限交流的人群(下图)则在开始移动后才发现有人要反向拉,造成僵持。
简而言之,大群蚂蚁形成的“短期集体记忆”带来了近似“贴墙右手法则”式的启发式策略:一旦进入迷宫,就一直靠着墙面前行;并且蚂蚁还会偶尔离开并再次接触墙体,从而防止在环形通道中陷入无限循环(附录图 S5I;参考 42 了解“绝对右手法则”可能存在的局限)。相较之下,小蚂蚁群更像是随机游走,会做更多无效尝试,也更可能被困于死胡同。大群蚂蚁的此类贴壁搜索策略,正与不少已有的迷宫算法研究相契合(43–45)。
人类解题者
我们已经看到大群蚂蚁相较于小群更能选择直接路径(图 4A, 附录图 S7B);人类(无论个体或群体)在通过各个状态区时,更倾向直接经过,而不是绕行(附录图 S6C)。可以说,人类通常把三维的状态空间理解成了一个离散的“图”,其中各“状态”是节点(例如“负载还完全在第一房间”称为状态 ),而物理上可能的状态转移则相当于节点之间的连线(图 1C, D)。由于人类无法直接知晓哪些邻接边实际上是断开的(34, 35),就只能把所有邻接可能都当做潜在选项(在 图 1C 中,用实线或虚线标示这些节点之间是否真的连通)。
一旦发现某条边是断开的,就把它“剪除”并在记忆中加以标记。这种不断试错的过程让人类能够从初始状态渐进式地建立一条通往最终目标的有效路径(图 4A 与 附录图 S6A–C)。这种尝试利用了长期记忆:人们很少会再次尝试通过先前已被认定为断开的路径(附录图 S7A),即便回到了同一个状态区的不同位置(附录图 S6D)。这也说明了,人类会对较大的连续状态进行整合,一视同仁地处理(例如把“负载在第一房间的任何配置”都视作同一个节点)。
虽然所有单个人都在进行类似的图搜索,但他们在细节上仍有差异(图 2B 中的表现分散)。例如,在状态 时,可能有人会倾向先让“长横杆”通过缝隙,也有人倾向先让“短横杆”通过;也有人能根据左右对称性(附录图 S1B, C)推断某些边“等效”从而提前剪除。我们统计发现,人类对节点转移的 约 符合“在树形图上做深度优先搜索(DFS)”这一启发式方法(46),见图 4B。
当多个人凑到一起搬运时,每个个体的判断不尽相同,就需要建立共识才能协作搬动负载。对比能说话/不能说话两种人群时,其决策方式有很大差异。我们可从若干“决策分叉”来洞察这种差异:一个分叉指的是在当前状态节点有两条都没尝试过的边,一条是“贪心选项”,若成功可使负载离出口更近(见图 4C 上方示意);另一条是更“迂回”的间接选项(下方示意)。我们发现,在这 5 个常见分叉里,交流受限人群相比单个人和自由交流人群,更常去尝试贪心选项(图 4C),最终导致其整体解题表现也更差(图 2B)。
为何交流受限人群更倾向贪心?我们先观察他们的共识形成过程:在一次解题开始时,此类人群往往只等不到一秒钟就开始移动负载(图 4D);力学测量显示,一旦负载开始运动,群体就会像蚂蚁那样将各自的施力方向对齐到负载已在运动的方向(图 4E;也见 47)。并且在穿越节点的过程中,负载不会轻易改变方向,也不会偏离最短路线(图 4A)。用社会学视角来描述,这像是“一锤子买卖式的多数投票”:在决策分叉时,那些不受墙壁限制、能自由施力的“领导子群体”会朝自己主观觉得更优的方向拉拽负载,合力方向相当于一次多数表决(或称寡头决议,参见 48),一旦负载向哪个方向开始移动,其余所有人就会跟着将拉力对准该方向。
这样一来,我们只需知道领导子群的初始拉力方向即可推测整群最终如何选择。若假设领导子群的偏好与单人解题时的统计相同,显然无法解释为何在一些情形下,即便大多数单人都选“间接”,群体却最终选了“贪心”(比如 图 4C 右侧分叉)。因此我们在模型中增设了一个“贪心”参数:在领导子群中,每位成员仅有 概率会忠于自己单人时的选择,另有 概率会转而拉向“贪心”选项。通过仅调节 即可与实验数据(中号与大号群体在 5 个分叉中的 9 个决策点)较好地拟合(图 4C)。
产生这类“贪心”倾向或许有多种原因:一方面,人在大号谜题里处于更“局部”的位置(负载与场地都更大),且没法通过语言共享信息,因此更可能只注意到自己附近的那道门口,从而推着/拉着物体直接往那儿走(51)。另一方面,一旦禁止讨论,人们希望尽早达成一致,这种“群体迷思”(groupthink,见21, 52)也会让很多人放弃他们真正认为对的方案,转而支持“他们推测其他人也会选”的更显而易见选项。由于贪心往往优于随意选择,所以整群很容易快速形成一个“还算不错”的共识;就算该路线真是死路一条,也能让大家进一步形成共同认知(55),下一次决策就会往另一个选项走。
相比之下,允许交流的人群会花更多时间在行动前进行讨论(图 4D),他们也会在起动之前就把各自的拉力方向统一到目标节点上(图 4E)。这样就摆脱了一次性表决的限制,可以花时间去说服他人,进而在分叉处选择一些更绕但更优的路径(图 4D;也见附录图 S6E)。事实也表明:决定走“间接路径”通常需要更久的讨论,这印证了交流在形成此类“非显而易见”共识时的重要性。
大多数分叉中,允许交流的人群最终选择与“典型单人”相近(图 4C),说明这类人群可能就像随机“选出”某个参与者作为“带头人”,全程跟随其主意(与我们的一些观察也相符,见附录注释 6)。结果表现确实与单个人大体相当(图 2B)。值得注意的是,由于该谜题实在太绕,绝大多数单人的直觉也不是全对的,所以若是以多数投票来决策,效果甚至会更差(见附录注释 10)。而在现实中,我们发现此类自发的“随机选择一个带头人”确实是群体常见的做法。不过,这也导致群体在平均意义上要尝试更多状态转移,而不如把真正最擅长的人选出来当带头人效率高(附录注释 9),故总体表现比单人略好,但不会好太多。
尽管如此,允许交流的人群还是比“平均水平的单人”稍优(图 2B),主要原因是他们在死胡同(例如状态 )时,能更快达成共识退出,而无需在里面反复尝试所有错误分支(附录注释 7)。有些人在言语中就能直接指出这是死路,从而避免更多无谓探索(56)。换言之,只要有少部分人看透了局面,就能借由讨论说服大多数朝正确方向调整(48, 50)。
对比蚂蚁与人类
在“搬钢琴”任务的物理实现中,我们获得了两种难得的研究机遇:其一,可以在群体规模从 1 到若干个体的不同层次上,比较解题能力;其二,可以在物种层面比较蚂蚁与人类的集体解题表现(尤其是限制人类仅靠力传递信息时,与蚂蚁有更强的可比性)。
大型蚂蚁群通过涌现的方式获得了“短期记忆”——这正是认知的关键要素(6, 7):携带负载的蚂蚁在方向上形成了一种类似自旋对齐的有序状态(38),把当前运动方向“存”在群体的瞬时结构中。这让蚂蚁群可以执行更高层次的动作,比如持续沿墙滑动,直至找到门口再前进。与此类似的“群体带来新感知/记忆能力”的例子并不多见:已有研究发现,鱼群能通过聚集来扩大环境感知范围,进而对大尺度的环境梯度做出反应(8);也有研究发现,鱼群可通过调整自身群体结构来修正对于风险的评估(22)。
这种涌现记忆让大群蚂蚁能做类似“系统化的墙面扫描”,很可能找到最短路径,从而大幅提升了小群无法企及的解题效率。从记忆、定向运动、系统搜索与启发式策略等角度看,大群蚂蚁竟与人类的解题方式有了某种相似之处。
而对人类而言,“搬运大物体”这个任务为研究“大规模自然合作”提供了宝贵机会:在真实生活中,一群人往往会面对多重社会效应,如信息交换、意见形成、错误引导等(48–50, 54, 56–58),其最终结果并不容易预测。与蚂蚁不同的是,人类能独立解决谜题,但在群体合作中需要额外花力气形成共识,否则效率会受损。
当能说话时,人类群体花大量时间讨论,最终表现与个体相当;一旦受限交流,人们就像蚂蚁那样,通过施力的相互配合来选择下一步动作。但他们会把自己的复杂想法抛之脑后,退化成基于简化的贪心判断与随流对齐(36, 37),表现远不及个体。当恢复自由交流后,这种“蚂蚁式退化”才会消失。
从更宏观的角度看,蚂蚁与人类代表了两条不同的进化道路:蚂蚁更加依赖群体层面的集体认知,而人类则拥有高度发达的个体智力,但这也带来了群体内个体差异,致使需要更高水平的交流才能达到良好的集体合作。两个物种间的对比,指向了一个有趣的研究方向:在演化过程中,个体复杂度与群体易协作之间或许存在某种此消彼长的平衡(类似 70 中的思路)。再结合更多的跨物种、跨谱系研究,或许能更系统地认识这一点。对机器人集群的设计也可能由此获益(例如 71),并有助于理解为什么在众多社会性动物里,只有蚂蚁与人类能发展出如此高效的协作搬运能力。
材料与方法(Materials and Methods)
蚂蚁实验装置(Setup for Experiments with Ants)
我们以白色聚乳酸(PLA)材质 3D 打印了一个小型蚂蚁实验场地,用来构建地面和围墙。此外,在场地顶部加盖了一个透明罩,防止蚂蚁将负载搬运到场地边界之外。为了避免蚂蚁在将负载通过两道狭缝时将其倾斜并因此“作弊”,我们在这两道狭缝之间还加装了一层透明材料。附录图 S2A 中给出了该场地的结构示意图,附录图 S2 C、D 则分别展示了单只蚂蚁与小群蚂蚁在实验过程中解题的照片。
大型蚂蚁实验场地则先通过激光切割成若干尺寸合适的矩形塑料板,形成地面与围墙,再将它们组合粘合在一起构成最终场地。该场地在第一房间左侧开了若干通向另一室的孔洞,用以放置“招募环”(recruitment ring),以便在实验中增加场地内的蚂蚁数量,从而维持对负载的协同搬运。该场地的示意图如 附录图 S2B 所示,一张大型蚂蚁群进行解题的照片见 附录图 S2E。
用于小型和大型场地的负载,均采用红色聚乳酸(PLA)3D 打印,呈薄且坚硬的外形。附录图 S2 C–E 展示了它们分别置于相应场地中的情形。为确保与小型场地负载的周长—重量比相近,大型场地的负载仅保留了一个 “T” 形边框,因为蚂蚁能附着的数量大致与周长成线性关系。附录表 S1 列出了所有场地及负载的具体尺寸。
在实验前,我们在场地的围墙上涂了 Fluon(氟涂层),防止蚂蚁翻越围墙而逃出。我们还将负载在猫粮中放置一整夜,并涂抹了金枪鱼罐头,使其对蚂蚁具有食物的吸引力。
蚂蚁实验流程(Procedures during Experiments with Ants)
为进行单只蚂蚁或小群蚂蚁实验,我们将一个小型场地放置于位于以色列里霍沃特市(Rehovot)的魏茨曼科学研究学院(Weizmann Institute of Science)内一处 P. longicornis(长角疯蚁)蚁巢旁边。若要进行大型蚂蚁群实验,则改用前述的大型场地。对于任意规模的蚂蚁群,都将场地按 附录图 S1A 中定义的 -轴方向对准蚁巢入口。我们把一台佳能 EOS 550D 相机安装在一个可移动支架上,置于场地上方进行拍摄(参考 附录图 S2 A, B)。相机以每秒 50 帧的速率和 1280×720 的分辨率进行录像。
接着,我们在场地的第一房间放置了一个涂抹过金枪鱼的“招募环”来招引蚂蚁进入场地。当场地内的蚂蚁数量足够多并开始协同搬运招募环时,移走招募环;随后开始录像,并在第一房间摆上一个 T 形负载,使其处于 附录图 S2B 中所示的初始位置。蚂蚁可以附着在这个薄边框上并将其搬起,如 附录图 S2 C–E 所示。
在单只蚂蚁的实验中,如果场地里已经有一只蚂蚁,则不允许另一只蚂蚁进入;若有第二只蚂蚁正要进入,则实验员用口吹的方式将其吹走。对于小群或大型群体实验,则不限制蚂蚁进出场地。所有实验中,蚂蚁都可随时离开场地:可能原因包括对负载失去兴趣,或前去招募更多蚂蚁。对于小群与大群实验,新的蚂蚁不断加入以替换离开的蚂蚁,从而大体保持了足够数量的蚂蚁完成协同搬运。附录表 S1 列出了实际参与搬运的蚂蚁数量。若在大型场地中,负载附近的蚂蚁数量不足以维持合作搬运,我们会把招募环移到第一房间左侧房间,以吸引更多蚂蚁进入场地。一旦负载被蚂蚁搬到完全进入第三房间(见 附录图 S2B 中的标记),则视为解题成功。若小群或大群在 30 分钟内未解出难题,则终止实验并记为“未成功”。而对于单只蚂蚁来说,在 30 分钟内很难搬运负载长距离,因此我们并未在 30 分钟时强制终止,而是允许蚂蚁长时间乃至数小时地进行搬运,其中相当一部分时间场地里并无蚂蚁在场。此外,3 个单蚂蚁实验中的两个跨越了多天;在重新开始时,我们将负载放回到上次停止时的位置,以便继续搬运从而达成更长的搬运距离。因而,我们将之称为“复合实验”(composite experiments)。数据相对稀疏是因为单只蚂蚁经常离开场地去招募更多同伴。此结果与我们的推测相符:该物种在进化中极大地依赖群体协作带来的益处。
单只蚂蚁、小群和大群解题过程的示例录像,参见 Movie S1–S3。这些实验历时 3 年,使用了 5 个不同的蚂蚁群体。
人类实验装置(Setup for Experiments with People)
为人类准备了三个场地,尺寸分别称为“小”“中”“大”,搭建于以色列里霍沃特的魏茨曼科学研究学院。其围墙高度超过 2 米,由金属网骨架加苫布封闭,以免参与者透过围墙观察外部环境。每个场地的负载均由一根“T”形塑料管固定在带轮子的推车上。塑料管上贴有粉色胶带,便于在视频中对负载进行跟踪(参见 图 3B 以及 附录图 S2 F–H)。附录表 S1 列出了各个人类场地及对应负载的具体尺寸。场地地面铺有碎石,并被压平以便推车顺畅移动。中型与大型场地的负载带有若干细长且坚固的把手,通过绑带固定在 T 形管周围。参与者可拉住这些把手搬运负载。对于某些人群实验,我们还在把手上集成了测力计,用于记录每位参与者的拉力。测力计来源于检测行李箱重量的装置,并整合进一个定制的数据采集系统,以 2 Hz 的采样率将每位参与者的实时拉力值写入硬盘。我们在三个场地顶部都装有摄像机拍摄整个过程,录像帧率为每秒 30 帧,图 3B 以及 附录图 S2 F–H 展示了拍摄的部分画面。
人类实验流程(Procedures during Experiments with People)
在进行单人或中、大群体实验前,会有一位向导(guide)向参与者进行简要说明。参与者包括通过魏茨曼科学研究学院的广告而前来报名的 10 岁及以上儿童和成年人,以及来自以色列各地的其它参观团体。每位参与者在解题期间都会佩戴亮绿色帽子。对于受限交流(restricted communication)的人群,参与者还需戴口罩和墨镜,以防止通过唇部或眼部进行沟通。向导将参与者带入场地,让他们看到第一房间中的负载处于起始位置,并说明负载需被搬运至第三房间。对于在小型场地进行解题的单人参与者,可对负载进行推或拉;中型和大型场地的人群只能通过分配给他们的把手施力(拉)。在受限交流组中,不允许言语和手势;更多具体实验指令见 附录注释 4。
当所有问题解释完毕后,向导向团队示意可以开始搬运负载。在解题过程中,只有当参与者违反已说明的规则时,向导才会出面干预并进行提醒。整个过程从上方拍摄。所有人类实验在 30 分钟内均成功完成解题,没有超过时间限制。单人和一个大型、受限交流的人群解题的典型录像可参见 Movie S4 与 Movie S5。本研究共计招募了 1251 名参与者。我们获得了魏茨曼科学研究学院和欧盟相关部门的许可才可开展人类实验。人类实验的伦理审批来自魏茨曼伦理委员会(IRB-Education)、以色列教育部首席科学家办公室,以及欧洲研究委员会(ERC)伦理部门。实验均依照他们的规范执行。所有参与者在实验前均签署了知情同意书。
视频分析(Video Analysis)
对于蚂蚁实验录像,每一帧中负载的质心坐标及其朝向由我们自行编写的 MATLAB 程序(MathWorks;版本 R2019b)获取。该程序通过阈值法先检测红色负载的像素,然后用与负载形状匹配的模板来确定负载的具体配置。
对于人类实验录像,我们同样编写了 MATLAB 程序,从每一帧图像中提取负载的质心位置和朝向。具体做法是:先对画面进行畸变校正,再用阈值法找出与参与者绿色帽子和负载粉色标记对应的区域。最后,通过 k-means 算法获得负载的位姿()。
根据需要,我们会对所得负载轨迹做人工修正。为了消除小幅度抖动,我们对每条坐标(、、)做如下平滑:对蚂蚁(单只或群体)而言,采用对应于 和 0.25 秒的时间窗口做中值滤波;对人类则相应选取合适窗口。在这些时间段内,负载不会发生显著速度变化。随后再用高斯滤波(Gaussian filter),窗口大小对应 。如此就能在去除抖动的同时保留负载的真实运动特征。
蚂蚁解题模拟(Simulations of Ant Solvers)
为进一步探明大群与小群在表现上产生差异的机理,我们基于一款成熟的蚂蚁协同搬运统计物理模型(3, 37, 38)对蚂蚁解题者进行了模拟。Movie S6、S7 展示了一个小群和一个大群蚂蚁解题的模拟动画。该模型基于实验证据,主要描述蚂蚁在负载上的附着与脱离动力学,及其沿身体轴向施力的叠加如何支配负载的运动。新近附着的蚂蚁在短暂时段内掌握方向信息(这里指向本谜题中的最近出口),并将它们的拉力朝着该方向施加,从而为负载提供确定性的方向指引。一旦蚂蚁忘记了这个方向信息,它们就以随机方式在“无信息拉拽者”(uninformed puller)与“抬举者”(lifter)之间转换,直到脱离负载。在拉拽角色的转换以及所有拉拽者的方向对齐中,无信息拉拽者经由刚性负载发生机械耦合。若其拉力方向与负载在附着点的运动方向更一致,便更可能保持在“拉拽者”的角色。与此同时,有信息的拉拽者则会让自己的施力始终与本地运动方向保持一致。这些因素共同导致负载整体出现涌现的一致性运动,并周期性地被注入由有信息拉拽者提供的方向校正。更多模拟细节参见 附录注释 1。
广义序参量(Generalized Order Parameter)
在此前研究中(3, 37, 38),顺序(order)更多用以描述线性上的运动持续性(linear persistence)。但在本谜题中,解题者需要在平移与旋转两个层面都具备持续性。为此,我们在蚂蚁解题模拟中定义了一个可同时衡量平移和旋转持久度的序参量 ,在时刻 :
其中 表示负载上所有(有信息或无信息)拉拽蚂蚁的数目, 表示某只拉拽蚂蚁在其附着点处施加的力方向, 表示在该附着点上感应到的局部运动方向;若该位置有拉拽蚂蚁则 , 否则 。更多细节见 附录注释 1。 因为 同时度量了拉拽者与负载边缘局部运动方向的一致性,所以不仅能捕捉到负载线性平移方向上的对齐,也能衡量那些有助于负载持续旋转的拉拽者排列状态。
路径长度(Path Length)
我们将给定时段里解题者在状态空间中所走过的累计距离定义为“路径长度”。这可近似视为与负载相连的搬运者在该时段走过的平均路程。为便于在不同尺寸场地中进行比较,我们将该路径长度归一化,采用图 1A 所标注的“两道狭缝之间的宽度” 作为缩放因子:
其中 表示负载质心坐标, 为负载在第 帧(或时间步)处的转动角度,而 总帧数(或时间步数)。
负载转动角度的变化量需要乘以负载外围到质心的平均距离 ,它与负载及场地尺寸呈线性关系。由于蚂蚁或人都附着在负载边缘并跟随其一起转动,这样定义的路径长度可合理反映负载旋转时,平均搬运者所行进的距离。我们通过在负载外围等距取点并计算它们到质心的距离来数值获得 。
负载路径速度(The Load’s Path Speed)
对于时刻 (下标 对应一个时间索引),负载在路径坐标(configuration space)中的速度定义为
其速度大小(path speed)即该速度的欧几里得范数 。
状态与转移区间(States and Transition Regions)
如 图 1C, D 所示,我们将状态空间分割成多个“状态”。所有可行的负载配置都属于某个状态,但其中一部分配置还包含在一些“转移区间”中。详情见 附录表 S3,以及 附录图 S1D, E。当参与者将负载从某状态移动至该状态内某个转移区、且该转移区几何上靠近某一“相邻却不连通”的目标状态时,就可视为一次尝试。
我们区分了和 两个转移区(见 附录图 S1E),因为我们经常观察到,人类解题者会在状态 中,从该转移区的两个对称子区域尝试通过。为区分这两条通道并分别惩罚无效穿越,我们将其拆分为 与 (详见 附录表 S3)。
尝试的状态转移次数(Number of Attempted State Transitions)
根据 附录表 S3 中定义的条件,我们为搜索轨迹上的每一个配置分配对应的状态或转移区。随后统计成功与失败的状态转移次数;其中“成功”或“失败”通过判断在各状态或转移区停留时间是否超过 1 秒来识别。这样得到轨迹在图中尝试跨越边界的次数。一个示例见 图 4B。
一组解题尝试的累积分布函数(Cumulative Distribution Function of a Set of Attempts)
如 图 2 和 附录图 S4 所示,为生成某一解题者集合的累积分布曲线,我们先计算该集合中每一次解题的性能指标,或为该尝试的累计路径长度(公式 (2)),或为尝试的状态转移次数。在这两种情形中,数值越大代表解题表现越差。
我们找到这批解题者中成功尝试的最大数值 ,并将所有“未成功”的尝试里数值 小于 的排除不计,得到一个新的成功尝试集合。接着在 0 与 之间等距取若干 ,对于每个 ,我们计算中 的成功尝试所占比率,即对应 的成功累积分布。误差计算方式为 。最终得到 (, ) 及对应的误差,即该尝试集合的累积分布函数。
离散化的状态空间(Discretized Configuration Space)
状态空间指负载与场地不会发生重叠的所有可行配置集合。我们在一个三维网格上做数值计算,以判断每个体素单元是否可行,这些体素位于:、、 所围成的区域(详见 附录图 S1A 表示的场地几何尺度)。若可行则标记为 1,否则为 0,最终得到一个“离散化状态空间”。附录表 S1 和 S2 列出了每个谜题使用的网格尺寸。我们保证网格分辨率足以区分状态空间中各主要连通分量之间的通路。
与场地边界的距离及“接触”判定(Distance from the Boundary, and Criteria for “Contact”)
我们利用 Python 包 scipy.ndimage 中的 distanctransformedt 函数,计算离散化状态空间每个体素单元到场地边界的欧几里得距离。借此,就能得到负载在一个轨迹段上距离场地边界的变化情况,附录图 S5H 中的直方图即基于该方法。
对于 图 3A, B 以及 附录图 S5 A, B, I 中呈现的实验数据,我们通过回放录像手动追踪负载何时与墙壁接触。除非额外注明,其他所有碰壁检测都采用同一方式:一旦轨迹对应的离散单元与围墙的距离小于某个阈值 ,就视为“接触”,否则视为未接触。对于 图 3A, B 以及 附录图 S5A, B 中的模拟数据,我们取 。
节点间最短路径(Shortest Path between Nodes)
我们分析了小群蚂蚁与中等规模人类在从状态 进入 并最终进入 的所有轨迹段(参见 图 1C, D),以量化解题者对“最短路径”的遵从度。具体做法:先用 scipy.interpolate.interp1d 函数将这些在状态 内的轨迹段等分成 100 个坐标点,其中 表示在从状态 转移出后第一次进入 时的配置, 表示离开 并进入 前的最后配置。
然后用 skfmm.distance 函数计算在状态空间中从到各点 的距离,再除以 到 的初始距离。当解题者从 进入 后,在某条路径上走到对应进度时,该距离记作 。基于这些数据绘制的热图见 图 4A 与 附录图 S6B。
深度优先搜索(Depth-First Search)
我们将各状态与转移区作为图中的节点(图 4B),并为它们赋予一个“深度值”,表示从初始节点到达它所需的最少状态/转移区转移次数。转移区(见 附录图 S1D, E)视作图中的死胡同。在每条人类解题轨迹中,我们统计有多少状态转移与“深度优先搜索”策略吻合:1)若目标节点深度大于等于起始节点,且目标节点尚未被访问过;2)自上一次进入死胡同后,目标节点的深度一直小于起始节点的深度。对于对称区域(如 与 ),我们视为不同的节点,所以解题者可在不违反 DFS 的前提下访问二者。同时,我们允许解题者事先“剪除”某些不连通的边,从而无需真正去访问这些边。例如可以直接从 走到 ,而不必访问 和 ,并不违背 DFS。人类解题者偏离此策略的两大原因:其一是再度进入同一转移区,尝试穿越一条不存在的边;其二是在尝试穿越本应存在的一条边(如 )时失败,回到了先前已剪除的边上。
决策分叉(Decision Forks)
我们将一个“决策分叉”定义为:1)以某个起始条件(初始状态 ,或此前一次成功/失败的边转移)为前提,2)此时有两条尚未尝试的边——“贪心”(greedy)和“间接”(indirect)。附录图 S7 B, C 以及 图 4C 中列举了出现最频繁的五个决策分叉:
(1)
当开始于状态 时:贪心边 或 间接边 。
(2)
通过边 后:贪心边 或 间接边 。
(3)
尝试通过边 后:贪心边 或 间接边 。
(4)
通过边 后:贪心边 或 间接边 。
(5)
通过边 后:贪心边 或 间接边 。
我们将对称边(如 与 )视为等价。需要注意,在分叉 (5) 处,解题者也可以先试图通过边 再尝试 或 ,但这从未发生,因为那会让负载朝与出口相反的方向前进,故不纳入考虑。
人类决策分叉的模拟(Simulations of Human Decisions at Decision Forks)
为探究在受限交流组中,个体意见如何汇总成群体决策,我们构建了一个简单的多智能体模拟(agent-based simulation):
首先,根据单人解题时在五个分叉上的统计概率(图 4C),把每个智能体的初始意见设为“贪心”(记为 1)或“间接”(记为 0)(其中中等规模人群, 大型人群 )。
然后,以概率 将所有持 0 意见的智能体改为 1;
接着确定群体最终决策:
我们重复此模拟 2000 次,并对所有分组决策结果求平均。仅通过调节一个参数 ,我们在 时就能与实验结果较好地吻合(见 图 4E),验证了该模型的合理性。
统计信息(Statistical Information)
附录表 S1(实验)与 S2(模拟) 列出了本研究中解题尝试的重复次数()。图 4E 中显示的拉力测量图,分别来源于 8 组和 5 组测力计稳定工作的人群实验(对应可交流和受限交流两类)。除非另有说明,其他图表均整合了所有实验和模拟的观测数据。图表中的平均值作为集中趋势度量,误差条一般表示均值 ± 1 标准误(SE),除非特别说明。
数据、材料与软件的可用性(Data, Materials, and Software Availability)
(原文未提供具体下载链接或存储位置,仅在此标题下表示如果需要可联系作者或见原文)
鸣谢(Acknowledgments)
我们感谢 Matan Feinerman 协助设计本谜题,感谢 Michael Oren 开展初步实验,感谢 Aviram Gelblum 提供其追踪软件及支持,以及 Lena Demmeler 在数据收集中给予的帮助。我们感谢 Guy Han、Yuri Burnishev、Rostyslav Baron、Ami Maimon、Meir Alon、Yeruham Shimoni 和 Agza Elihaho 在场地和负载的各类规模搭建方面给予的技术支持。本研究受欧盟“地平线 2020”(Horizon 2020)项目(欧洲研究理事会,ERC,资助协议编号 770964)资助。A.K. 获以色列科学基金会(https://www.isf.org.il)1574/24 号项目的支持。O. F. 担任 Henry J Leir 讲席教授;E. F. 担任 Tom Beck 研究员讲席;N. G. 担任 Lee and William Abramowitz 生物物理学讲席教授。
作者贡献(Author contributions)
T.D.、E.F. 和 O.F. 设计了研究;T.D.、A.H.、N.G.、E.F. 和 O.F. 实施了研究;T.D.、A.H.、A.K. 和 O.F. 分析了数据;T.D.、A.H.、A.K.、N.G. 和 O.F. 撰写了论文。
竞争利益(Competing interests)
作者声明不存在竞争利益。
附加信息(Supporting Information)
下载 PDF(7.28 MB)
Movie S1.
记录了单只蚂蚁连续解题的过程(加速播放 10 倍,并裁剪掉无负载运动的长时间片段)。场地地面上相邻红点之间相距 2 cm。
下载 (3.30 MB)
Movie S2.
记录了一个小蚂蚁群解题的过程(播放速度加快 10 倍),地面上相邻红点之间相距 2 cm。
下载 (8.78 MB)
Movie S3.
记录了一个大蚂蚁群解题的过程(播放速度加快 10 倍),地面上相邻红点之间相距 2 cm。
下载 (6.93 MB)
Movie S4.
记录了单个人解题的过程(播放速度加快 10 倍)。
下载 (3.01 MB)
Movie S5.
记录了一个大型、交流受限的人群解题的过程(播放速度加快 10 倍)。
下载 (4.77 MB)
Movie S6.
模拟动画,展示了一个小蚂蚁群如何解题(播放速度加快 18 倍)。知情拉拽蚂蚁、无信息拉拽蚂蚁和抬举蚂蚁分别以蓝、绿、黑标出。每个网格边长 1 × 1 cm。
下载 (6.58 MB)
Movie S7.
模拟动画,展示了一个大蚂蚁群如何解题(播放速度加快 10 倍)。知情拉拽蚂蚁、无信息拉拽蚂蚁和抬举蚂蚁分别以蓝、绿、黑标出。每个网格边长 1 × 1 cm。
下载 (3.89 MB)