成为“第一个”,不只依靠算力“硬件”。“训练基地要干的,不只是训练。”运营训练基地的北京亦庄智能城市研究院公司总经理颜敏解释,使用数据时会面临所有权归谁、是否可信、如何保障安全、收益如何分配等各种问题,都需要建立机制来规范。为此,基地针对大模型训练的数据合规和场景应用了“监管沙盒”机制,为新技术创新迭代提供开放包容的政策保障,免除后顾之忧。</p>
4.首个AI软件工程师上线,能力远超 GPT-4</p>
首个人工智能软件工程师Devin发布。在 SWE-bench 基准测试中,它无需人类帮助,可解决 13.86% 的问题。相比之下,GPT-4 只能处理 1.74% 的问题,且都需要人类提示告知处理哪些文件。Devin被介绍为世界首个完全自主的AI软件工程师。据介绍,它已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。</p>
Devin背后公司名为Cognition AI,总部设在纽约和旧金山,定位是一家专注于推理的应用AI实验室。目前该团队规模仅有10人,但共揽获了10 枚IOI金牌。目前,Devin 尚未对外开放,但已经有不少开发人员和产品人员拿到了测试资格,并再次引发了AI能否替代程序员的讨论。</p>
——总结·点评——</p>
本月AI技术创新领域呈现出多维度的创新与发展,涉及软硬件技术突破、教育应用、基础设施建设以及AI角色的拓展。以下是几大亮点的总结:</p>
软件层面的去中心化尝试:面对英伟达在AI芯片领域的主导地位,高通、谷歌、英特尔等科技巨头联合通过UXL基金会推广OneAPI技术,意在打造一个芯片无关的软件开发环境。这一举措旨在为AI开发者提供更多选择,减少对单一平台的依赖,推动行业多元化发展。</p>
AI赋能教育的国家级行动:中国教育部启动了四大行动,利用AI技术改善教育资源、提升教学质量、推动教育公平及伦理规范。通过国家智慧教育平台的升级、大模型应用示范、国际交流等措施,加速了教育体系的智能化转型。</p>
基础设施的规模化建设:北京启用国内首个人工智能数据训练基地,配备大规模公共算力平台,不仅在算力规模上达到国内顶尖水平,还引入“监管沙盒”机制,为AI模型训练提供高效且合规的数据使用环境,促进了AI技术研发与应用创新。</p>
AI技术角色的跃升:Cognition AI发布的Devin,作为首个无需人类提示即可独立解决问题的AI软件工程师,展示了AI在复杂逻辑处理和专业技能方面的巨大进步,其在基准测试中的表现远超预期,引发关于AI在未来工作中角色的深刻讨论。</p>
这些动态共同描绘了AI领域当前的快速发展图景,既包括了对既有格局的挑战与重构,也体现了AI技术向更广泛社会领域渗透的趋势,预示着AI将在教育、技术研发、基础设施建设等方面发挥越来越重要的作用。</p>