AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%
AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%
AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%大模型的发展落地日新月异,就在年初,业界还在担心AI生产的学术垃圾充斥论文库(lùnwénkù),年中,AI生成的论文已经(yǐjīng)可以被顶会认可了。
5月29日,海外初创公司Intology 宣布,他们的“AI科学家”Zochi的论文被顶会ACL主会议录用(lùyòng),成为首个独立通过 A* 级别(jíbié)科学会议同行(tóngháng)评审的AI,同时宣布开放Zochi的Beta 测试(cèshì)。
这一发布的含金量在(zài)于,ACL是自然语言处理(chǔlǐ)领域全球排名第一的顶会,其主会议平均录用(lùyòng)率通常低于20%,论文(lùnwén)需具备突破性创新。据悉,Zochi的论文获得评审最终评分4分,在所有投稿论文中排名前8.2%。
Intology是一家较为陌生的(de)初创公司,从目前官网(guānwǎng)和博客的信息梳理来看,这家公司是在2025年初新成立的,定位是一个研究智能科学的实验室,两名联创分别是连续(liánxù)创业者Ron Arel和前Meta华人(huárén)研究员Andy Zhou,两人均毕业于伊利诺伊大学(yīlìnuòyīdàxué)厄巴纳-香槟分校(UIUC)。
Intology成立后,此前3月团队就推出了智能体Zochi,称其为(chēngqíwèi)AI科学家,并宣布其研究成果已被ICLR 2025研讨会接收。不过,此前的这一研讨会的论文接收率在60%-70%,要求比顶会(dǐnghuì)的主会低了不少(bùshǎo),官方(guānfāng)认为,此次更进一步(gèngjìnyíbù)的顶会突破标志着AI达到博士级科研水平,人类(rénlèi)博士通常需数年才能在此类会议发表。
具体看此次AI科学家Zochi“写”的(de)论文,主题是关于大模型安全的,名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,直译过来(lái)是《Tempest:基于树(shù)搜索的大模型自主(zìzhǔ)多轮越狱(yuèyù)》,简单来说,Zochi利用(lìyòng)了一种“树搜索”技术,来探索多种对话(duìhuà)路径,逐步突破大模型的安全防线。
研究提出的Tempest框架,能通过多轮对话逐步(zhúbù)瓦解模型(móxíng)的安全防线,绕过安全检测,通过小让步的累积完成违规的内容输出。例如,直接(zhíjiē)让模型回答敏感信息“制作炸弹”,基于安全机制模型会(huì)直接拒绝,但通过多轮委婉地(dì)引导提问,最终却可以让模型回答出正确的信息。
评估结果显示,Tempest在OpenAI的(de)(de)旧模型GPT-3.5-turbo上(shàng)的成功率为100%,在GPT-4上的成功率为97%。这一研究主要是揭示了多轮对话攻击的漏洞(lòudòng),可以为设计更佳的AI安全防御提供参考。
值得一提的(de)是,论文的署名是两位联创,但官方博客表示,除论文格式调整与(yǔ)绘图外,内容全程无人工参与(cānyù),“我们对这项工作负责,但主要的智力贡献是由AI系统完成的” 。
据官方介绍,人类仅输入研究领域,Zochi就可以独立完成后续全流程。Zochi 首先会(huì)采集并分析(fēnxī)数千篇研究论文,以确定特定领域内有潜力的(de)研究方向(fāngxiàng)。其检索系统(jiǎnsuǒxìtǒng)能够识别文献中的关键贡献(gòngxiàn)、方法论、局限性以及新兴模式,识别论文之间不明显的联系,并提出创新的解决方案。从提出假设到完成实验,就像一个真正的科学家。
AI科学家并非(bìngfēi)个例,除了Intology外(wài),Transformer作者Llion Jones去年创立的Sakana AI,也推出了一个基于AI的科研(kēyán)系统(xìtǒng)“AI Scientist”,论文也已被ICLR 2025研讨会接收,分数为6/7/6。
AI for Science(AI4Science)一直是AI行业最前沿的(de)落地领域之一(zhīyī),人工智能可以(kěyǐ)极大地促进科学的进步(jìnbù),提高科学家的效率、准确性和创造力。不过,新事物的出现也伴随着合理性和规则适配的争议。
此前3月Intology 推出Zochi、宣布论文被会议接收时(shí),就(jiù)被不少学术界(xuéshùjiè)人士批评,认为这是对科学同行(tóngháng)评审过程的滥用,在提交论文前,团队并未知会相关方是AI生成的论文,也未获得同行评审者的同意。
在此次博客最后,官方提到了(le)AI带来(dàilái)的学术伦理问题(wèntí),认为AI驱动的研究给科学问责和可重复性带来了挑战。但他们认为,虽然 Zochi 自主运营,但人类研究员仍然(réngrán)是作者,并负责验证方法、解释结果并确保符合伦理规范。对于论文,人类作者进行多轮内部审查,并在提交前仔细核实了所有结果和代码(dàimǎ)。
“我们(wǒmen)鼓励在致谢中列出AI系统,而不是将其列为作者。虽然AI驱动的研究提出了关于(guānyú)归属、透明度和问责制的重要问题,但我们认为,智力贡献应该以实质内容而非来源来评判。”Intology官方(guānfāng)表示,他们(tāmen)的主要关注点是通过AI工具协助人类研究者。
(本文(běnwén)来自第一财经)
大模型的发展落地日新月异,就在年初,业界还在担心AI生产的学术垃圾充斥论文库(lùnwénkù),年中,AI生成的论文已经(yǐjīng)可以被顶会认可了。
5月29日,海外初创公司Intology 宣布,他们的“AI科学家”Zochi的论文被顶会ACL主会议录用(lùyòng),成为首个独立通过 A* 级别(jíbié)科学会议同行(tóngháng)评审的AI,同时宣布开放Zochi的Beta 测试(cèshì)。
这一发布的含金量在(zài)于,ACL是自然语言处理(chǔlǐ)领域全球排名第一的顶会,其主会议平均录用(lùyòng)率通常低于20%,论文(lùnwén)需具备突破性创新。据悉,Zochi的论文获得评审最终评分4分,在所有投稿论文中排名前8.2%。
Intology是一家较为陌生的(de)初创公司,从目前官网(guānwǎng)和博客的信息梳理来看,这家公司是在2025年初新成立的,定位是一个研究智能科学的实验室,两名联创分别是连续(liánxù)创业者Ron Arel和前Meta华人(huárén)研究员Andy Zhou,两人均毕业于伊利诺伊大学(yīlìnuòyīdàxué)厄巴纳-香槟分校(UIUC)。
Intology成立后,此前3月团队就推出了智能体Zochi,称其为(chēngqíwèi)AI科学家,并宣布其研究成果已被ICLR 2025研讨会接收。不过,此前的这一研讨会的论文接收率在60%-70%,要求比顶会(dǐnghuì)的主会低了不少(bùshǎo),官方(guānfāng)认为,此次更进一步(gèngjìnyíbù)的顶会突破标志着AI达到博士级科研水平,人类(rénlèi)博士通常需数年才能在此类会议发表。
具体看此次AI科学家Zochi“写”的(de)论文,主题是关于大模型安全的,名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,直译过来(lái)是《Tempest:基于树(shù)搜索的大模型自主(zìzhǔ)多轮越狱(yuèyù)》,简单来说,Zochi利用(lìyòng)了一种“树搜索”技术,来探索多种对话(duìhuà)路径,逐步突破大模型的安全防线。
研究提出的Tempest框架,能通过多轮对话逐步(zhúbù)瓦解模型(móxíng)的安全防线,绕过安全检测,通过小让步的累积完成违规的内容输出。例如,直接(zhíjiē)让模型回答敏感信息“制作炸弹”,基于安全机制模型会(huì)直接拒绝,但通过多轮委婉地(dì)引导提问,最终却可以让模型回答出正确的信息。
评估结果显示,Tempest在OpenAI的(de)(de)旧模型GPT-3.5-turbo上(shàng)的成功率为100%,在GPT-4上的成功率为97%。这一研究主要是揭示了多轮对话攻击的漏洞(lòudòng),可以为设计更佳的AI安全防御提供参考。
值得一提的(de)是,论文的署名是两位联创,但官方博客表示,除论文格式调整与(yǔ)绘图外,内容全程无人工参与(cānyù),“我们对这项工作负责,但主要的智力贡献是由AI系统完成的” 。
据官方介绍,人类仅输入研究领域,Zochi就可以独立完成后续全流程。Zochi 首先会(huì)采集并分析(fēnxī)数千篇研究论文,以确定特定领域内有潜力的(de)研究方向(fāngxiàng)。其检索系统(jiǎnsuǒxìtǒng)能够识别文献中的关键贡献(gòngxiàn)、方法论、局限性以及新兴模式,识别论文之间不明显的联系,并提出创新的解决方案。从提出假设到完成实验,就像一个真正的科学家。
AI科学家并非(bìngfēi)个例,除了Intology外(wài),Transformer作者Llion Jones去年创立的Sakana AI,也推出了一个基于AI的科研(kēyán)系统(xìtǒng)“AI Scientist”,论文也已被ICLR 2025研讨会接收,分数为6/7/6。
AI for Science(AI4Science)一直是AI行业最前沿的(de)落地领域之一(zhīyī),人工智能可以(kěyǐ)极大地促进科学的进步(jìnbù),提高科学家的效率、准确性和创造力。不过,新事物的出现也伴随着合理性和规则适配的争议。
此前3月Intology 推出Zochi、宣布论文被会议接收时(shí),就(jiù)被不少学术界(xuéshùjiè)人士批评,认为这是对科学同行(tóngháng)评审过程的滥用,在提交论文前,团队并未知会相关方是AI生成的论文,也未获得同行评审者的同意。
在此次博客最后,官方提到了(le)AI带来(dàilái)的学术伦理问题(wèntí),认为AI驱动的研究给科学问责和可重复性带来了挑战。但他们认为,虽然 Zochi 自主运营,但人类研究员仍然(réngrán)是作者,并负责验证方法、解释结果并确保符合伦理规范。对于论文,人类作者进行多轮内部审查,并在提交前仔细核实了所有结果和代码(dàimǎ)。
“我们(wǒmen)鼓励在致谢中列出AI系统,而不是将其列为作者。虽然AI驱动的研究提出了关于(guānyú)归属、透明度和问责制的重要问题,但我们认为,智力贡献应该以实质内容而非来源来评判。”Intology官方(guānfāng)表示,他们(tāmen)的主要关注点是通过AI工具协助人类研究者。
(本文(běnwén)来自第一财经)



相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎