你的位置:开发一个手机小程序需要多少钱 > 小程序开发 > 小程序开发 早半年发arXiv,却被质疑抄袭:活在微软AutoGen暗影里的CAMEL

小程序开发 早半年发arXiv,却被质疑抄袭:活在微软AutoGen暗影里的CAMEL

时间:2024-08-24 17:35:09 点击:110 次

起原:机器之心Pro小程序开发

机器之心报谈

机器之机杼剪部

arXiv 不是同业评审期刊,是以发在 arXiv 上的论文无须被援用,这合理吗?

如果你对 AI 智能体感趣味,那你一定知谈微软的 AutoGen。它是一个用于构建 AI 智能体的开源编程框架,允好多个智能体通过聊天来处罚任务。其间,LLM 智能体不错上演多种脚色,如循序员、议论打算师,或者各式脚色的组合。

在 GitHub 上,这个花式也曾收货了 28k 的 star 量,论文还在 ICLR 2024 LLM Agent Workshop 上得回了最好论文奖。

不外,这篇论文的背后其实是存在争议的。

2023 年 11 月,一位 AI 研究者(阿卜杜拉国王科技大学博士,开源花式 Camel-AI.org、DeepGCNs.org 的发起东谈主李国豪)发帖称,由于 AutoGen 与他们的论文 CAMEL 高度一样,他们每次出席行径的时候王人会被问,二者有什么鉴别?

对此小程序开发,李国豪暗意额外无奈,因为他们的论文发布在 arXiv 上的时刻要彰着早于 AutoGen,如今却被当成了 AutoGen 的效法者(CAMEL 发布于 2023 年 3 月;AutoGen 发布于 2023 年 8 月)。

论文邻接:https://arxiv.org/abs/2303.17760

论文邻接:https://arxiv.org/pdf/2308.08155

凭据李国豪的说法,二者在方法论上存在以下一样之处:

以至用到的例子也有点一样:

当作其后者,AutoGen 如着实论文中提到过 CAMEL,并指出了 CAMEL 与 AutoGen 之间的一些相反。但这些内容出现的位置令东谈主微辞 —— 它们全王人出当今附录中。这可能亦然导致其他研究者只知 AutoGen,不知 CAMEL 的一大原因。毕竟,有几个东谈主会去仔细看附录呢?

AutoGen 论文中说起 CAMEL 的段落:「CAMEL(Li et al., 2023b)是一个通讯智能体框架,它展示了怎样使用脚色上演来让聊天智能体相互相易以完成任务。CAMEL 还能记载智能体对话以进行行动分析和智商瓦解。CAMEL 使用了一种「inception-prompting」本事完了智能体之间的自主和解。与 AutoGen 不同的是,CAMEL 本人不援助器具使用(如代码扩充)。尽管 CAMEL 被提议当作多智能体对话的基础设施,但它只援助静态对话模式,而 AutoGen 还援助动态对话模式。」

表 1 为 AutoGen 与其他筹商多智能体之间的相回转头,从四个目标入部下手判断:一是基础结构,即系统是否议论打算为构建 LLM 应用循序的通用基础结构;二是对话模式,即系统援助的模式类型。在「静态」模式下,非论输入怎样,智能体拓扑结构王人保捏不变。AutoGen 允许纯确实对话模式,包括不错凭据不同应用循序需求定制的静态和动态模式。三是可扩充,即系统是否不错扩充 LLM 生成的代码;四是东谈主工参与,系统是否(以及怎样)允许东谈主工参与扩充流程。AutoGen 允许东谈主工纯真地参与多智能体对话,并允许东谈主工汲取跳过提供输入。

AutoGen 论文中说起 CAMEL 的段落:「AutoGen 不错匡助竖立智商超强的智能体,充分欺诈 LLM、器具和东谈主类的上风。创建这样的智能体对于确保多智能体使命流冒失灵验地摒除故障并在职务中取得发达至关热切。举例,小程序开发公司资讯价格咱们不雅察到,另一个多智能体 LLM 系统 CAMEL 在大多量情况下无法灵验处罚问题,主如若因为它阑珊扩充器具或代码的智商。这一失败标明,仅有浅近脚色上演的 LLM 和多智能体对话是不够的,还必须有具备各式技巧的高等智商智能体。咱们以为,开展更系统的使命,制定针对特定应用的智能体指南,创建大型 OSS 学问库,并创建冒失发现和进步自身技巧的智能体是必要的。

在 AutoGen 提交给 ICLR 主会议审稿时间,CAMEL 一作李国豪在环球评述区指出了这一问题,并强调这是「值得提防的遗漏」。

在针对 AutoGen 的审稿想法中,ICLR 的审稿东谈主和领域主席也指出了这种作念法的不当之处。

其中,领域主席写谈,「作家如着实附录中商酌了这一使命,但这种作念法是不行取的,因为补充材料的审核级别与论文的审核级别不同。简而言之,这似乎允许作家说他们援用和商酌了论文,但本色上并莫得在 99% 的东谈主可能阅读的论文部分进行援用和商酌。我以为这种作念功令东谈主担忧。」

那 AutoGen 的作家为什么这样作念呢?他们复兴说:在他们将论文提交给 ICLR 2024 时,CAMEL 等论文尚未在同业评审会议 / 期刊上发表。凭据 ICLR 2024 审稿东谈主指南,他们莫得义务援用这篇论文或与之比拟(CAMEL 于 2023 年 9 月被 NeurIPS 2023 委派;ICLR 2024 审稿东谈主指南轨则,在 2023 年 5 月 28 日之后发表的论文不需要援用)。

同期,他们列出了论文中波及 CAMEL 的部分:

鉴于 ICLR 轨则在先,领域主席也不好多说什么。他写谈,「天然我瓦解这项计谋背后的基开心趣,但在现时的出书氛围下,它可能会导致奇怪的着力。由于 ICLR 的计谋,我不会将其纳入我的决定中,但这会裁减我的信心。」

小程序开发

对于李国豪说起的一样性,AutoGen 作家也给出了反驳想法:

针对审稿东谈主建议的问题,他们复兴如下:

最终,和 CAMEL 之间的一样性以及援用问题并未当作论文的主要问题被领域主席议论在内。不外,AutoGen 论文最终照旧因为其他原因被拒(是以其后作家转投了 ICLR 2024 LLM Agent Workshop)。

凭据李国豪的说法,两篇论文的作家其着实线下见过面,但发生了一些不欢畅:

[扫码下载app,中过数字彩1千万以上的专家都在这儿!]

[扫码下载app,中过数字彩1千万以上的专家都在这儿!]

李国豪但愿冒失通过发帖引起学术界的青睐。

对此,你奈何看呢?

服务热线
官方网站:gubiw.cn
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:2852320325
邮箱:w365jzcom@qq.com
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号

Powered by 开发一个手机小程序需要多少钱 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024 云迈科技 版权所有