Top Seed人才计划 - 豆包大模型团队

Top Seed 人才计划

我们在寻找这样的你

“Top Seed项目介绍”

Top Seed 人才计划是字节跳动豆包大模型团队面向高校研究人才推出的专项，下设针对博士毕业生的应届生招聘与优秀在校生的研究实习生招聘。我们希望在全球范围内持续寻找有志于投身 AI 研究的顶尖人才。

加入我们，一起向智能上限发起挑战！

有极强的技术信仰与热情

有极强的技术信仰与热情，敢于挑战业界最难的问题，探索未知的技术路线，希望做出改变 AI 历史的研究

具备出色的研究能力

对 AI 领域某一具体方向有深度的技术见解，发表过高质量、有影响力的论文，或有代表性的开源工作

富有好奇心和驱动力

有很好的技术品味和直觉，富有好奇心和驱动力，除了已有的经验成果，我们同样看重你的研究潜力

实习生招聘

2025 年 9 月及以后毕业的博士及本硕在读同学

应届生招聘

2024 年 9 月 - 2025 年 8 月毕业的博士同学

实习生招聘

2025 年 9 月及以后毕业的博士及本硕在读同学

我们非常重视 Top Seed 研究实习生的体验

重视实习同学

与正式员工享有同样权限和资源

高度科研自由

可自主决定研究课题，支持灵活实习形式，如远程实习、校企合作实习等

尊重技术开放

支持发表研究成果，内部研究经验充分共享

认可实习贡献

提供远超行业、最具竞争力的实习薪酬

研究方向和课题

大模型

奖励模型和强化学习模型的泛化性

奖励模型和强化学习模型的自学习

大语言模型的可解释性

大语言模型的真实性

下一代强化学习算法

基于Self Play的大语言模型

机器学习算法和系统

设计高效率的大模型结构，用最少的训练、推理成本，获得更好的效果

研究超大规模训练集群，如何让训练的稳定性和 MFU 提升，跨集群训练

研究如何解决推理的访存 bound，多机推理，各种不同的推理并行方案

结合下一代计算体系，研究更先进的模型结构、训练模式、推理模式

研究大模型中 foundation 的算法问题，找寻算法创新

多模态生成

视觉生成基座模型研发：高交互性与可控性的图像/视频生成基础模型，探索视频视觉规律建模与多任务应用

3D/4D 生成与物理世界建模，探索生成驱动的渲染与物理引擎

多模态生成模型优化：网络架构设计、扩散模型加速、高效分布式训练与推理技术

多模态理解

多模态理解基础模型：融合语言、视觉、听觉的通用模型，强化图像/视频中的文本、布局、空间关系等基础能力

多模态推理与 Agent 能力突破：多模态 RAG、视觉 CoT 推理、GUI/游戏场景的通用 Agent 构建

生成-理解统一建模：连续/离散信号联合表示与训练方法，实现生成与理解的动态交互

多模态世界模型构建：基于仿真与预训练的虚拟/现实环境建模，支持多模态交互探索

语音

音频基座大模型研发：语音识别/合成/转换、音乐/音效生成的统一建模

多模态语音模型优化：网络架构创新、扩散模型轻量化、端侧推理加速

强化学习在语音场景的应用：语音/音频多模态任务中的 RL 算法与系统优化

和优秀的研究员一起探索

吴永辉

Seed-基础研究负责人2023 Google Fellow

2001 年本科毕业于南京大学，后获加州大学河滨分校计算机科学博士与统计学硕士学位。2008 年起在谷歌任职 17 年，从搜索算法优化起步，后成为 Google Brain 团队核心，是谷歌神经机器翻译、RankBrain 项目主要贡献者。2023 年晋升为“Google Fellow”和谷歌 DeepMind 研究副总裁。
2025 年加盟字节跳动，担任大模型团队 Seed 基础研究负责人。

王程一

RLHF、Super Reasoning等前沿领域研究

微软亚洲研究院与南开大学联合培养博士，师从周明博士。博士期间主攻语音大模型预训练，在 ACL、ICML 等多个国际顶级会议发表多篇论文，拥有多项发明专利。代表性工作包括 WavLM、VALL-E 等。论文曾获 InterSpeech 最佳学生论文、IEEE SPS 最佳论文提名，VALL-E 入选 Netexplo 评选 2023 年度十大创新项目之一。
2023 年加入字节跳动豆包大模型团队，研究方向涵盖 RLHF 和 Super Reasoning 等前沿领域。

秦禹嘉

多模态Agent研究开源项目GitHub星标累计2万+

清华大学电子系本科，计算机系博士。博士期间曾在 ICLR、NeurIPS、Nature Machine Intelligence、ACL、EMNLP 等国际顶级会议上发表多篇论文，谷歌学术引用 3,800+ 次。发布 UI-TARS、XAgent、ToolBench 等多个开源项目，GitHub 星标累计 2 万余次。
2024 年加入字节跳动豆包大模型团队，研究方向为多模态 Agent，包括 Computer Use、Game Agent 等。

钟宛君

大语言模型超级对齐与推理研究2021 MSRA Fellowship

2023 年毕业于“中山大学-微软亚洲研究院联合培养博士”项目并取得计算机科学博士学位，师从周明博士与印鉴、王甲海教授。读博期间获评 2021 MSRA Fellowship、博士生国家奖学金与 CVPR 挑战赛冠军。
现为字节跳动豆包大语言模型研究团队研究员，专注大语言模型超级对齐与推理方向研究，主导的大语言模型测评集合 AGIEval 被各大主流厂商应用。

项亮

Foundation机器学习和推荐系统

2006 年毕业于中国科学技术大学自动化系，保送中国科学院自动化所并获得博士学位。研究方向为机器学习和推荐系统。《推荐系统实践》作者、ResysChina 推荐系统社区创始人。
加入字节跳动后在 Al Lab 研究视频理解，后担任推荐系统负责人。2021 年加入 AML，现为字节跳动 AML 和豆包大模型 Foundation 团队负责人，带领团队探索基础和前沿 AI 算法及工程技术。

王雨轩

深度学习、语音方向研究谷歌学术引用量18,000+

俄亥俄州立大学获博士学位，专注于深度学习、语音技术等方向的研究和应用。领导了语音行业多个突破性工作，成果被广泛应用于学界和工业界。
担任字节跳动豆包大模型语音部门负责人，带领团队进行多模态生成和理解相关的基础研究和产品化工作。

冯佳时

视觉基础研究谷歌学术引用量69,000+

新加坡国立大学获博士学位，专注于计算机视觉、机器学习领域研究及其在多媒体中的应用。
担任字节跳动豆包大模型视觉基础研究团队负责人，包括视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究与落地。曾任新加坡国立大学 ECE 系助理教授，领导机器学习和计算机视觉研究实验室，指导或共同指导近 20 名博士生。

田值

视觉生成模型谷歌学术引用量15,000+

澳大利亚阿德莱德大学获计算机科学博士，师从沈春华教授。曾获得 2019 年 Google PhD Fellowship。
现任字节跳动豆包大模型视觉生成模型技术专家，专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量 15,000+ 次。

陈卓

音频生成研究谷歌学术引用量12,000+

2017 年于美国哥伦比亚大学获博士学位，而后在微软担任核心应用科学家。
担任字节跳动豆包大模型音频生成研究团队负责人。发表 100 多篇研究论文和专利，推动了多个语音任务的前沿发展，在语音生成、识别和翻译，语音分离和增强，说话人识别和日志，语音自监督学习，多通道处理以及开源语音数据集等方向都有突出贡献。

王明轩

大语言模型研究NeurlPS、ACL等会议领域主席

中国科学院计算技术研究所获博士学位。现为字节跳动豆包大语言模型研究团队负责人。在机器翻译领域，发表顶级会议论文 50 多篇并多次在 WMT 国际机器翻译评测比赛中夺冠。
参与开源 lightseq、mrasp 等多个项目，已经在行业内广泛使用。长期担任 NeurlPS、ACL、EMNLP 等会议领域主席和赞助主席。

Seed实习生
正在做有全球影响力的研究

Trusted by：

任同学在豆包大模型团队长期实习三年，作为第一作者发表的 VideoWorld 研究入选 CVPR 2025 并获广泛关注，DeepMind 等顶级学术团队邀请进行分享

任同学

豆包大模型 Vision 团队

应届生招聘

2024 年 9 月 - 2025 年 8 月毕业的博士同学

应届生招聘

2026 届 Top Seed 校招项目即将启动，请大家持续关注

2024 年 9 月 - 2025 年 8 月毕业的博士同学

研究方向和课题

大模型

奖励模型和强化学习模型的泛化性

奖励模型和强化学习模型的自学习

大语言模型的可解释性

大语言模型的真实性

下一代强化学习算法

基于 Self Play 的大语言模型

机器学习算法和系统

设计高效率的大模型结构，用最少的训练、推理成本，获得更好的效果

研究超大规模训练集群，如何让训练的稳定性和MFU提升，跨集群训练

研究如何解决推理的访存bound，多机推理，各种不同的推理并行方案

结合下一代计算体系，研究更先进的模型结构、训练模式、推理模式

研究大模型中foundation的算法问题，找寻算法创新

多模态理解和生成

多模态（图像、音频、视频）理解和生成的基座大模型，以及多模态理解和生成的统一模型

多模态模型网络结构设计和优化、扩散模型的设计和优化、高效的大规模分布式训练和推理系统

3D生成和世界模型，探索3D物体与场景的高效表示方法，从视频数据学习世界知识，构建物理世界模型

音频理解和生成基座大模型，探索语音识别、合成、转换、音乐生成、音效生成的统一建模方式

和优秀的研究员一起探索

严林

Post-trainRLHF自学习模型

研究生毕业于中科院计算所，现任字节跳动豆包大语言模型 Post-Training 团队负责人。关注指令微调、奖励模型、RLHF、RLAIF 和自学习模型方向。同时，在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。

李成刚

Pre-train数据清洗/合成/配比Scaling Capability

清华大学机械工程本硕学位。先后担任字节跳动今日头条网页搜索和 TikTok 视频搜索技术负责人，从 0 到 1 研发字节跳动搜索系统，在 ranking 架构和算法、多语言和多模态相关性领域有较大创新突破，把中文搜索体验做到领先水平。
任字节跳动豆包大语言模型预训练方向负责人，研究领域有数据清洗、合成、配比，关联学习与课程学习，训练算法与 Scaling Capability 等。

项亮

Foundation机器学习和推荐系统

王雨轩

深度学习、语音方向研究谷歌学术引用量18,000+

冯佳时

视觉基础研究谷歌学术引用量69,000+

田值

视觉生成模型谷歌学术引用量15,000+

陈卓

音频生成研究谷歌学术引用量12,000+

王明轩

大语言模型研究NeurlPS、ACL等会议领域主席

答疑专区

应届生招聘

实习生招聘

Top Seed 人才计划与筋斗云人才计划有何不同？

两个人才计划均面向 2025 届博士同学，研究方向有所不同。如果你有志于投身 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等方向，请选择 Top Seed 人才计划。如果你有志于投身 AI 应用、搜索、推荐、广告、Al Safety、隐私与安全、硬件、视频架构、工程架构等领域，请选择筋斗云人才计划。

两个人才计划的投递机制是怎样的？

如果我是 25 届候选人，已拿到其他团队实习 Offer，还可以投递 Top Seed 人才计划的岗位吗？

更多问题，欢迎邮件咨询

topseed@bytedance.com

立即投递