*01
Seed Edge 项目介绍

Seed Edge 是字节跳动豆包大模型团队内部组建的 AI 长期研究计划,以寻找通用智能的新方法为工作目标,鼓励项目成员探索更长周期的、具有不确定性和大胆的 AI 研究课题。Seed Edge 鼓励跨模态、跨方向的交叉合作,为项目成员提供宽松的研究环境,独立的算力资源,并实行更长周期的考核方式。
*02
Seed Edge 研究方向

探索推理能力的边界
以 O1 为代表的技术路线证明了推理能力可以推动智能边界提升,我们也在实践中发现对推理能力的研究才刚刚开始,有大量未探索的问题值得去深耕。无论是预训练算力级别的大规模强化学习,还是预训练和强化学习的迭代,或是可泛化的 Test-Time Scaling,每一项技术突破都会推动智能边界前进一步。

探索感知能力的边界
我们相信智能和交互是相辅相成的,通用模型除了有极高的智能水平,还需要具备极强的和人类沟通交流的能力。我们会统一生成和理解表示,探索世界模型建模;从真实世界原始数据直接进行压缩,探索比语言更好的对世界进行表示的建模,突破智能的边界受限于语言的约束。

探索下一个Scaling方向
继 Pretraining Scaling 和 Test-Time Scaling 之后,下一个 Scaling 方向对未来智能边界的演化会起到重要的作用。探索下一个 Scaling 方向,并推动智能边界的进步。

探索下一代学习范式
探索对未来的学习范式有变化的方向,挑战现有范式的“共识”,给更高效地实现通用智能提供基础和可能性。通过可解释性研究理解模型学习能力的来源,并进一步提出新的学习视角,探索模型在学习过程中的表现,和生物启发的学习过程对比,发现现有模型学习范式可以改进的空间:探索比 Next-Token Prediction 更高效的学习目标;探索比 Backpropagation 更高效的学习方法;探索比大数据 Pretraining+Alignment 更高效的学习范式。

探索软硬一体的下一代模型设计
Transformer 的高效很大程度上取决于它与 GPU 的适配性,能充分发挥 GPU 的性能。我们希望面向下一代训练和推理硬件的结构特点设计下一代模型,从软硬件一体的角度思考未来的模型结构特性,达到训练效率、推理效率、模型性能的多目标同时优化,并进一步压榨下一代硬件的能力,突破模型能力的边界。
*03
在 Seed Edge 可以体验
- 自由宽松的研究环境Seed Edge 研究计划以寻找通用智能的新方法为工作目标,围绕该工作目标,我们支持大家提出新的问题,灵活组成新的课题组
- 独立管理的算力资源Seed Edge 研究计划内,所需算力资源将按照研究项目独立进行管理和分配
- 坚持长期主义研究拉长 Seed Edge 同学的考核周期,注重长期研究成果的价值和影响力
- 鼓励跨模态合作鼓励跨模态、跨方向交流合作,促进不同模态知识的交叉融合
*01
Seed Edge 项目介绍

Seed Edge 是字节跳动豆包大模型团队内部组建的 AI 长期研究计划,以寻找通用智能的新方法为工作目标,鼓励项目成员探索更长周期的、具有不确定性和大胆的 AI 研究课题。Seed Edge 鼓励跨模态、跨方向的交叉合作,为项目成员提供宽松的研究环境,独立的算力资源,并实行更长周期的考核方式。
*02
Seed Edge 研究方向

探索推理能力的边界
以 O1 为代表的技术路线证明了推理能力可以推动智能边界提升,我们也在实践中发现对推理能力的研究才刚刚开始,有大量未探索的问题值得去深耕。无论是预训练算力级别的大规模强化学习,还是预训练和强化学习的迭代,或是可泛化的 Test-Time Scaling,每一项技术突破都会推动智能边界前进一步。

探索感知能力的边界
我们相信智能和交互是相辅相成的,通用模型除了有极高的智能水平,还需要具备极强的和人类沟通交流的能力。我们会统一生成和理解表示,探索世界模型建模;从真实世界原始数据直接进行压缩,探索比语言更好的对世界进行表示的建模,突破智能的边界受限于语言的约束。

探索下一个Scaling方向
继 Pretraining Scaling 和 Test-Time Scaling 之后,下一个 Scaling 方向对未来智能边界的演化会起到重要的作用。探索下一个 Scaling 方向,并推动智能边界的进步。

探索下一代学习范式
探索对未来的学习范式有变化的方向,挑战现有范式的“共识”,给更高效地实现通用智能提供基础和可能性。通过可解释性研究理解模型学习能力的来源,并进一步提出新的学习视角,探索模型在学习过程中的表现,和生物启发的学习过程对比,发现现有模型学习范式可以改进的空间:探索比 Next-Token Prediction 更高效的学习目标;探索比 Backpropagation 更高效的学习方法;探索比大数据 Pretraining+Alignment 更高效的学习范式。

探索软硬一体的下一代模型设计
Transformer 的高效很大程度上取决于它与 GPU 的适配性,能充分发挥 GPU 的性能。我们希望面向下一代训练和推理硬件的结构特点设计下一代模型,从软硬件一体的角度思考未来的模型结构特性,达到训练效率、推理效率、模型性能的多目标同时优化,并进一步压榨下一代硬件的能力,突破模型能力的边界。
*03
在 Seed Edge 可以体验

- 自由宽松的研究环境Seed Edge 研究计划以寻找通用智能的新方法为工作目标,围绕该工作目标,我们支持大家提出新的问题,灵活组成新的课题组
- 独立管理的算力资源Seed Edge 研究计划内,所需算力资源将按照研究项目独立进行管理和分配
- 坚持长期主义研究拉长 Seed Edge 同学的考核周期,注重长期研究成果的价值和影响力
- 鼓励跨模态合作鼓励跨模态、跨方向交流合作,促进不同模态知识的交叉融合