撰文 | 新皮层小组
编辑 | 吴洋洋
已经没有人再怀疑agent了。
2025年作为「agent元年」的地位正越来越牢固。Manus以Anthropic去年年底发布的Claude 3.5 Sonnet模型构建的通用agent在全球出圈后,全球各大模型厂商发布新模型时都会强调其模型的两个卖点:代码能力和适合构建agent。
Kimi在DeepSeek R1模型大火之后蛰伏了半年,终于在过去一周发布了第二代推理模型K2,同样强调代码能力和agent能力。并且,它还效仿了DeepSeek的出圈路径,走开源模式,第一步先去海外开源社区展示自己,也试图先在技术圈火起来,再把这股火热传导至大众圈。
OpenAI也在上一周发布了通用agent——ChatGPT agent,试图覆盖过去由外部开发者独占的通用agent功能,包括操作浏览器、做深度研究,还有制作PPT之类的。这些能力过去是Manus、Genspark等产品的主打功能,它们基于大模型公司的基础模型构建。现在,大模型公司自己进入了模型的上游应用领域。市面上的通用agent可能会被大模型公司吃掉不少是预料之中的事,因为只要足够通用、用户规模够大,大模型公司就有动力进入并覆盖。两年前的「模型即应用」理论现在依然适用,只不过关键词变成了通用agent——「模型即通用agent」。
在模型公司进入agent领域的同时,针对AI coding公司和人才的争夺同样激烈。一周前,Google以24亿美元的对价挖走AI编程公司Windsurf的CEO Varun Mohan、联合创始人Douglas Chen及核心团队部分成员后,7月15日,Vibe Coding公司Cognition收购了Windsurf的剩余团队和资产,因为Vibe Coding能自主完成的主要还是简单编程场景,Windsurf则是半自动型编程AI,在理解代码上下文、预判下一步代码编写上拥有技术储备。OpenAI也曾试图收购Windsurf,但被Google截胡了。
关于Vibe Coding、AI Coding的自然语言编程大战和agent大战接下来还会继续,欢迎关注「新皮层」跟进了解这些内容。
Key Points
国内
月之暗面发布K2模型,强调代码能力和Agent能力;
MiniMax又融3亿美元,智谱转向港股上市;
字节视觉大模型负责人杨建朝离职,周畅接任;
全球
苹果考虑收购Mistral;
Meta收购AI音频公司Play AI;
Devin母公司收购Windsurf剩余部分;
Waymo无人驾驶达到1亿英里里程;
Lovable融资2亿美元,晋升独角兽;
OpenAI发布通用agent。
国内
月之暗面发布K2模型,强调代码能力和Agent能力
7月11日,月之暗面发布Kimi K2模型,并同步开源。这款模型的总参数达到万亿级别(1T),是目前开源模型中最大的,激活参数320亿。月之暗面称,K2的代码能力更强,擅长通用Agent任务。官方发布的测评结果显示,在基准性能测试中,K2模型在自主编程方便的能力仅次于Claude 4 Opus,在工具调用方面的能力仅次于GPT-4.1。K2发布后,成为HuggingFace上热度第一的开源模型,Perplexity称将在该模型基础上展开后训练。
MiniMax又融3亿美元,国资入场
7月14日,有报道称,MiniMax新一轮3亿美元的融资已接近完成,投后估值超40亿美元(约合人民币300亿元),本轮融资出资方包括上市公司、交叉基金和上海国资。这是MiniMax第一次获得国资入股。其此前出资方包括云启资本、高瓴创投、IDG、明势资本、米哈游、腾讯和阿里巴巴等,其中腾讯在其A轮融资中加入,阿里巴巴在B轮加入。加上这次融资,MiniMax共完成5轮融资,估值仅次于智谱的400亿元。MiniMax计划在香港上市。另有7月11日报道称,智谱计划转至港股上市,寻求约3亿美元融资。此前,它计划在A股IPO。
字节视觉大模型负责人杨建朝离职,周畅接任
7月17日,字节跳动豆包大模型视觉多模态生成负责人杨建朝在公司内部宣布自己将「暂时休息」,相关工作已完成交接。杨建朝的岗位隶属于Seed团队的「多模态交互与世界模型」部门,向吴永辉汇报。杨建朝离职后,其工作由周畅接手。杨建朝于2018年加入字节跳动,担任AI Lab美国研发总监。2023年,字节成立大模型团队后,杨建朝转任视觉多模态生成负责人。加入字节跳动前,杨建朝曾在Adobe、Snapchat等公司工作。接任者周畅去年从阿里巴巴跳槽加入字节跳动Seed团队。
全球
苹果考虑收购Mistral
7月13日,有报道称,苹果正在寻求收购总部位于法国的AI初创公司Mistral,并购金额可能超过30亿美元。Mistral是欧洲当前估值最高的人工智能独角兽,估值约58亿欧元。Mistral旗下拥有聊天机器人Le Chat,以推理响应速度快闻名,每秒可处理1100个tokens。除了Mistral,苹果还在考虑收购AI初创公司Perplexity,消息称苹果已与Perplexity高管举行了多轮会面。苹果还寻求采购OpenAI和Anthropic的方案来支持新一代Siri,但谈判因价格问题而陷入了停滞。不久前,苹果的人工智能高级主管庞若鸣(Ruoming Pang)也被Meta挖走了。
Meta收购AI音频公司Play AI
7月14日,有报道称,Meta完成对AI音频初创公司Play AI的收购,交易金额未透露。Play AI成立于2021年,是一家利用AI生成人类声音的初创公司,掌握高保真的语音克隆、多语言实时转换及情感化语音生成技术。Meta在AI角色、可穿戴设备和音频内容创作等领域业务广泛,对Play AI的收购有利于它进一步布局与AI语音相关的可穿戴市场,比如讲AI语音能力植入其AI眼镜中。收购Play AI之前,Meta已收购AI图像生成公司Scenic、自然语言处理初创公司Lobster等,此外,它还花148亿美元收购了数据标注公司Scale AI 49%的股份,并重金招募了苹果AI团队基础模型前负责人庞若鸣及OpenAI研究人员等顶尖人才。
Google挖走Windsurf创始人和核心人才后,Devin母公司收购Windsurf剩余部分
7月15日,AI编程工具Devin的母公司Cognition宣布收购另一AI编程工具Windsurf,具体的收购金额未知。Cognition将承接Windsurf总计250人的团队,并获得Windsurf绝大多数的技术专利。这意味着Windsurf渡过了濒临解散的危险期。7月11日,Google以24亿美元的对价挖走了Windsurf的CEO Varun Mohan、联合创始人Douglas Chen及核心团队部分成员,并获得了Windsurf部分技术的非独占许可,而Windsurf的其余人员被留在了原公司。
Waymo无人驾驶达到1亿英里里程
7月15日,有报道称,Waymo的一位高管表示,该公司的Robotaxi(自动驾驶出租车)在无人驾驶的情况下,累计行驶里程已超过1亿英里(约合1.6亿公里,相当于绕地球赤道40圈),在大约6个月内翻了一番。目前,Waymo仍是美国唯一一家正式进入商业化运营阶段的Robotaxi公司,在美国的旧金山、洛杉矶、凤凰城、亚特兰大、奥斯汀等地运营着约1500辆自动驾驶出租车。上个月,特斯拉的Robotaxi在奥斯汀启动商业化试运营,投放了十几辆Model Y。7月17日,Waymo表示,他们在奥斯汀的运营范围将从37平方英里扩大至90平方英里,以应对特斯拉的挑战。
Lovable融资2亿美元,晋升独角兽
7月17日,有报道称瑞典Vibe Coding公司Lovable 近日完成2亿美元A轮融资,投后估值达18亿美元,跻身独角兽行列。Lovable成立于2023年,主营产品是帮助普通用户通过自然语言创建网站和应用程序。自上线以来,该公司平台活跃用户超230万,付费用户超18万。目前,Lovable团队人数仅45人,已实现7500万美元的ARR(年度经常性收入)。Lovable上一轮融资是在今年2月,当时它获得了1500万美元Pre-A轮融资。
OpenAI发布通用agent
7月18日凌晨,OpenAI发布了「通用agent」——ChatGPT agent。这是OpenAI发布的首个「通用agent」。此前,Manus、Genspark等华人创业团队都推出过同类产品,号称能完成不止一种类型的多步骤任务。与同类产品一样,ChatGPT agent会在必要时主动向用户确认信息,例如在发送邮件前。另外,在ChatGPT agent工作时,用户可以随时插话追加任务,它会基于新信息继续推进工作,且不丢失之前的进度。让ChatGPT不再仅仅是回答问题,而是能够长出「手和脚」,帮用户完成多种操作类任务,这是ChatGPT自2023年11月底推出以来的最大产品迭代。
-END-