首页 财经 理财 产业 商业 证券 消费 图片 视频 全国

科技

旗下栏目: 科技 汽车 房产 工农

字节发布 Seed Prover 1.5:全新 Agentic 架构,更强数学推理表

来源: 作者:碧海醫心 人气: 发布时间:2025-12-24
摘要:字节跳动Seed团队推出新一代形式化数学推理专用模型SeedProver1.5,通过大规模的AgenticRL训练,其推理能力和推理效率取得显著进步。相比上一代模型,SeedProver1.5在16.5小时

字节跳动 seed 团队推出新一代形式化数学推理专用模型 seed prover 1.5,通过大规模的 agentic rl 训练,其推理能力和推理效率取得显著进步。相比上一代模型,seed prover 1.5 在 16.5 小时内,针对 imo 2025 的前 5 道题目生成了完整可编译验证的 lean 证明代码,换算成绩为 35/42,达到此前 imo 评分标准的金牌分数线。

更系统的评估中,Seed Prover 1.5 在完整的 Putnam 历史评估集上解决了 88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了 80% 和 33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。

Seed Prover 1.5 针对 FATE-H 问题调用工具示例:

千面视频动捕

千面视频动捕是一个AI视频动捕解决方案,专注于将视频中的人体关节二维信息转化为三维模型动作。

下载

 

技术报告:https://arxiv.org/abs/2512.17260Lean
证明代码:https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip

源码地址:点击下载

责任编辑:碧海醫心
首页 | 财经 | 理财 | 产业 | 商业 | 证券 | 消费 | 图片 | 视频 | 全国

Copyright 2025 九掌金融版权所有  技术支持:政产学研(海南)投资有限公司 备案号:琼ICP备2025065810号-1

电脑版 | 移动版