1. 店铺起名 > 新闻热点 >

再见,Devin,基于GPT-4o,最强”AI工程师“Genie诞生

【再见,Devin,基于GPT-4o,最强”AI工程师“Genie诞生】在科技日新月异的今天,人工智能(AI)领域的每一次突破都牵动着全球科技爱好者的心。近期,AI界迎来了一场重大变革,一款名为Genie的AI程序员横空出世,它以惊人的表现在权威测试平台SWE-Bench上取得了30.08%的高分,远超此前备受瞩目的Devin(基于GPT-4o的AI工程师)的13.8%和Swe-agent+GPT-4的12.47%,正式宣告了全球最强AI工程师的诞生。

再见,Devin,基于GPT-4o,最强”AI工程师“Genie诞生

Devin,作为今年早些时候由Cognition Labs发布的AI编程产品,曾以其“全球首位AI工程师”的身份引起了广泛关注。它宣称能够端到端地构建和部署程序,自主查找并修复bug,甚至能够训练和微调自己的AI模型。然而,好景不长,Devin很快便陷入了质疑的漩涡。一位拥有35年软件工程师经验的网络博主卡尔,通过逐帧复现Devin的演示视频,提出了多项质疑,指出其编程能力存在欺骗性,所处理的任务并非随机,而是精心挑选的刻意呈现。这一事件不仅让Devin的声誉受损,也让整个AI界开始重新审视AI编程产品的真实能力。

而就在此时,Genie的横空出世无疑为AI界注入了一剂强心针。这款由Cosine公司发布的AI程序员,在训练数据和方法上进行了大胆创新。它摒弃了常规的大模型微调方式,转而采用了一个特殊的数据集,该数据集包含了人类程序员的推理过程、知识发现以及基于实际案例的决策制定步骤。这种独特的训练方式使得Genie能够像人类一样面对各种复杂问题,展现出与人类工程师相似的处理能力。

此外,Genie还引入了一种“自我改进机制”。在初始训练达到“完美”状态后,开发人员通过Genie生成合成数据,并将其注入到后续模型训练中,以丰富错误和复杂情况。这一过程类似于母亲教孩子走路,每当Genie出现错误或不足时,都会得到及时的纠正。随着每一次循环迭代,Genie解决复杂编码的能力越来越强,即使在面对全新问题时也能展现出高度的适应性和准确性。

功能方面,Genie覆盖了功能开发、BUG修复、代码重构、代码小改动、代码测试以及编写代码文档和更新等多个领域。它支持的编程语言包括JavaScript、Python、Java、C#、C++等几十种主流语言,几乎涵盖了所有编程领域的需要。这一全面而强大的功能集使得Genie在AI编程领域具有极高的应用价值。

随着Genie的诞生和逐步开放测试,我们有理由相信AI编程的未来将更加光明。虽然Devin的落幕让人惋惜,但Genie的崛起无疑为AI界带来了新的希望和动力。我们有理由期待在不久的将来,AI程序员将成为我们日常工作中不可或缺的一部分,为科技的发展和社会的进步贡献更大的力量。

王楚钦回应