
本文的第一组是张·吉金(Zhang Geibin),他是新加坡国立大学的计算机科学的医生;本文是根据Nanyang Technological University的Wang Kun博士指南完成的,上海人工智能实验室的Bai Lei先生和中国科学技术大学的Wang Xiang教授。在LLM代理商期间,代理商的能力达到了瓶颈,并形成了一个多代理系统,例如“代理人”,就证明了广泛的成功。但是“ Tiantiuan”不是更好的人。 manu -manu -Design是困难和不愉快的。现有的智能自动化方法只能“移动起火”,并使用复杂的阵容来解决所有问题,从而导致“用毒刺杀死鸡”,这很昂贵。现在,在新加坡国立大学,上海AI实验室,汤吉大学和其他机构的纸质穆拉,被接受为ICML 2025的口头介绍给我们带来了一个解决方案的新想法Em。他们在代理领域介绍了神经网络体系结构搜索(NAS)的想法,并创建了一个名为“代理超级奈特”的概念。它不再寻找固定的最佳“线”,而是根据任务的困难而动态地“削减”合适的代理团队。结果有多惊人?性能超过了最高11.82%的现有方法,但认可的成本仅为45%!纸质地址:https://arxiv.org/abs/2502.04180github链接:https://github.com/bingreeky.com/bingreeky/maas标题:由代理超级架构搜索:代理超级架构代理“集成”困境:从设计设计到浪费多个系统,从浪费多个系统,各种系统,各种系统,各种多种系统,许多领域的个体代理(例如发电代码,复杂和一般AI活动)。但是疾病的一个主要点总是存在:这些系统的设计通常依赖于疲劳 - 调整和立即工程。 To solve this problem, the research community is open to automatic design, such as finding the optimal flow of agent by studying the reinforcement, evolutionary algorithm, Monte Carlo Tree Search, etc. However, it brings new dilemma: 1. Wasting resources (dilemma 1): Automatic multiagent system optimizing procedures such as Aflow and Adas tend to find a very cumPlicated "pie-gold oil" system as to ensure all the taks in all taks.但是,解决一个简单的问题“ 10+1*2.5 =?”,无疑是使用需要十二个呼叫来源的复杂系统的大型资源。 2。任务冲突(困境2):在诸如Gaia之类的多域基准上,在文献摘要中良好的多古系统在Web浏览摘要中不一定很棒,在所有任务中都可以是最好的。面对这种“激情或自动浪费”的情况,我们应该改变思想吗?代理超级名单:主要贡献n从“选择”到“扩大所有要求”是一项良好的“范式改革”。建议我们不再沉迷于寻找Asingle,这是代理商的最佳体系结构。取而代之的是,我们应该优化一个“超级媒介” - 这是包含大量代理潜在体系结构的可能性的分布。图1超网剂的“超级名单”就像大型“阿森纳容量”,其中包含各种基本功能,例如思想链(COT),工具调用(反应)和多年龄(辩论)。当新任务到达时,“明智的控制器”将迅速研究困难和类型的任务类型,然后立即从此“ Arrifeet”中进行更改,并立即选择并组合最合适的“运算符”,以提出一个或多或少的自定义临时智能系统,并且不再是正确的源泉来解决问题。上图清楚地显示了它:有简单的问题(a,b):maas选择“早期”E第二层,并快速提供了I/O反应最简单组合的答案,这是高度节省资源的答案。对于中等和困难的问题(C,D):MAAS建立了更深入,更复杂的网络,呼吁更多操作员确保解决问题。 “按需分布和动态组合”的这种哲学是著名的NAS的确切思想。如今,MAAS框架已成功地将其应用于多衰老体系结构,据说这是代理商期间NAS的重生和成功。 Maas的“三个轴”如何在代理商的建筑中发挥作用?接下来,放弃马斯的“独特秘密”。它的主要想法可以摘要作为蓝图→智能调度→自动步骤策略的参考。第一个技巧:确定通用的“蓝图” - 超级代理的传统过程是设计代理的某种架构(系统),而MAAS的第一步是定义一个包含所有“ Unive”RSE“性的可能性 - 超自然的代理。1。代理操作员:首先,MAAS将代理系统介绍给一系列可用的“原子能”或“技能模块”,即操作员(O)。这包括:I/O包括:I/O:最简单的输入和输出。cot和outtut。最终的生存。每个层中“选择”的每个模块均未固定,并且可以是优化的。图2中的WN是Maas表现魔术的阶段。这不是静态系统,而是代理系统体系结构可能性的空间分布。第二个技巧:智能“调度程序” - 按需采样体系结构具有“蓝图”。当特定任务(查询Q)到达时,如何快速生成“自定义团队”?这是Maas的“智能调度员” - 控制器的转弯。抑制器的工作流量如下:1。“读”任务:控制者首先抓住了输入查询Q,以了解其意图和困难。 2。按一层选择该层:然后,它从超级的第一层开始。并按一层选择当前工作层的最合适的“技能模块”。 3。MOE风格的动态选择:这里选择的机制非常有特征,并且采用了类似于混合专家(MOE)的策略。在每个级别,控制器都会计算一个“激活标记”以选择所有技能模块。此标记取决于cur租用任务Q,哪个模块选择了上一层。然后,它从具有最高标记的模块开始,并被激活,直到这些活性模块的其余组合标记超过了预设阈值(Thres)。该设计与Maas的性格密切相关!这意味着:一个简单的任务只能将代理操作员激活到一定级别。复杂的任务将激活更多的操作员,也许是两个甚至三个,以确保足够的解决方案功能。同时,如果选择了特殊的“早期退出”操作员,则整个处理过程将尽早结束,完美地实现“当您看到它更好时停止”。通过这种方式,MAAS是动态生成一个独特的代理实现(G)的唯一图表,并为每个查询提供了正确的资源分配,实现了真实的“查询查找”。第三个技巧:双 - 轨道“进化的演变” - 成本障碍下的优化产生临时团队来执行任务。马斯也应该知道从经验来看,整个“超级名单”和“操作系统”将越来越强。但是这里有一个问题:实现代理的整个过程是“黑匣子”,与外部工具和API充满了联系,无法执行末端 - 端梯度反向传播! As such, Maas adopted an approach to dual -track -arranged strategy to update" distributing "architectural" 1. Evolution of architectural distribution (π) -Monte Carlo Strategy Gradient: The purpose of the maas is not only to be considered if the work is completed (performance), but also consider how much money the costs are (cost, such as the token number) Architecture (G_K) Try to solve the problem.Bahan (M_K)基于“成本绩效”(即高性能和低成本)。NT:这是最“神奇”的地方!如何优化提示或Python代码? Maas借出了“文本梯度”的概念。它使用梯度代理来研究操作员的性能(例如辩论运营商)。如果表现不好,则该“教练”将以文本的形式提出“改进的意见”,即“文本渐变”。示例:“在此Pinino进程的提示中添加一些照片。” “为了稳定,请在此集合模块中降低LLM温度。” “在DeratorateRate中添加'对手'论文以在更深入的讨论中激发灵感。”图3文本梯度案例性能,成本和多功能性:全部! MA的影响不仅是概念的,而且在数据中也令人印象深刻。图4上图显示了MAAS和其他多种义务方法之间的性能的比较。 GSM8K,MATH和HUMANEVAL,MAA的全面超过了现有的14种基线方法,并且该性能提高了0.54%至11.82%。 cMAAS要求的令牌的征服仅是现有的自动或Manu -Manuin Maas培训的45%仅为3.38美元,而类似的Aflow绩效高达22.50美元,这是6.8倍的变化。此外,MAAS优化时间仅持续53分钟,这比其他花费大量时间的方法要小。图6 MAAS成本可视化上图还显示了MAKA在训练令牌,令牌消耗和API值的消费中的良好表现。图7 MAA推理的动态显示。显然,对于不同级别的难度查询,Maas正在智能激活代理网络的各种架构来解决它。上图显示了MAA的主动状态,以查询不同级别的难度。可以看到MAA完美地实现了对任务难度的动态感知,从提前提前进行预见的过程,用于简单任务,用于复杂任务的HPOOR,它转到了第3-4层代理Supernet U,并且每一层都有多个操作剂。此外,MAA还显示了超级泛化功能:跨模型:使用GPT-4O-Mini优化的“超级磁铁”很容易切换到各种大型型号,例如QWEN-2.5-72B和LLAMA-3.1-70B,并带来了显着的性能提高。跨数据集:MAAS的数学培训和GSM8K测试,MAAS仍然表现正常,证明了跨域概括的力量。对于未知的运营商:尽管在实践中尚未看到操作员的“辩论”,但MAA在理解时仍然可以合理化和使用它,表现出惊人的感应能力。摘要:通过介绍“超级代理”的概念,明智地将MAAS应用于自动设计,在多衰变系统的自动设计中,完美的资源分辨率和性能瓶颈,由“单一适合所有”设计带到当前领域。它不再追求静态最好的解决方案ZE是一种动态生成的建筑分布,可为各种活动提供适当的工作,最有效的解决方案。毫无疑问,这项工作将为开发更好,经济和智能的完全自动AI系统而取决于道路。让我们拥有一个完全自动,自组织和自我进化的时期的集体智慧时期!