*01
Top Seed项目介绍
什么是 Top Seed
Top Seed 人才计划是字节跳动豆包大模型团队面向校园优秀人才推出的专项。我们希望在全球范围内持续吸引和招募目标远大、有志于“用科技改变世界”的顶尖人才。
字节跳动在持续加大对顶尖人才和前沿技术的投入力度。加入我们,你将和最优秀的科学家、工程师一起,参与行业顶尖的技术挑战和攻坚,以火种之名,点亮未来世界。
我们在寻找
/2024 年 9 月 - 2025 年 8 月毕业的博士同学
#怀有科技改变世界的远大抱负,敢于创新
)有志于投身机器学习、人工智能、大模型、计算机视觉、音视频生成等技术领域
&在相关学术研究、工程实践、开源社区等方面表现出色
*02
深度参与行业前沿课题,丰富的技术落地场景等你探索
大模型、自然语言处理、计算机视觉、语音、机器学习系统等领域课题等你挑战。
大模型
/ 奖励模型和强化学习模型的泛化性
/ 奖励模型和强化学习模型的自学习
/ 大语言模型的可解释性
/ 大语言模型的真实性
/ 下一代强化学习算法
/ 基于 Self Play 的大语言模型
机器学习算法和系统
/ 设计高效率的大模型结构,用最少的训练、推理成本,获得更好的效果
/ 研究超大规模训练集群,如何让训练的稳定性和MFU提升,跨集群训练
/ 研究如何解决推理的访存bound,多机推理,各种不同的推理并行方案
/ 结合下一代计算体系,研究更先进的模型结构、训练模式、推理模式
/ 研究大模型中foundation的算法问题,找寻算法创新
多模态理解和生成
/ 多模态(图像、音频、视频)理解和生成的基座大模型,以及多模态理解和生成的统一模型
/ 多模态模型网络结构设计和优化、扩散模型的设计和优化、高效的大规模分布式训练和推理系统
/ 3D生成和世界模型,探索3D物体与场景的高效表示方法,从视频数据学习世界知识,构建物理世界模型
/ 音频理解和生成基座大模型,探索语音识别、合成、转换、音乐生成、音效生成的统一建模方式
*03
顶尖导师团队,和认真做事的人一起挑战世界级难题
冯佳时
中国科技大学获学士学位,新加坡国立大学获博士学位。专注于计算机视觉、机器学习领域的相关研究及其在多媒体中的应用。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
项亮
2006 年毕业于中国科学技术大学自动化系。保送中国科学院自动化所并获得博士学位。研究方向为机器学习和推荐系统,2009 年曾参加 Netflix Prize 获得第二名,著有《推荐系统实践》一书。且于当年发起创建了 Resys China 推荐系统社区。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
王明轩
中国科学院计算技术研究所获博士学位。目前是字节跳动豆包大语言模型研究团队负责人。在机器翻译领域,发表顶级会议论文50多篇,并多次在WMT国际机器翻译评测比赛中拿到第一。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
严林
研究生毕业于中科院计算所,目前是字节跳动豆包大语言模型 Alignment 团队负责人。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
田值
澳大利亚阿德莱德大学获计算机科学博士,师从沈春华教授。曾获得 2019 年 Google PhD Fellowship。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
王雨轩
俄亥俄州立大学获博士学位,专注于深度学习、语音技术等方向的研究和应用。领导了语音行业多个突破性工作,成果被广泛应用于学界和工业界。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
陈卓
2017年于美国哥伦比亚大学获博士学位,而后在微软担任核心应用科学家。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
李成刚
清华大学机械工程本硕学位。先后担任字节跳动今日头条网页搜索和 TikTok 视频搜索技术负责人,从0到1研发出了字节跳动的搜索系统,在ranking架构和算法、多语言和多模态相关性领域有较大的创新和突破,在中文搜索体验上做到了领先水平。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
冯佳时
中国科技大学获学士学位,新加坡国立大学获博士学位。专注于计算机视觉、机器学习领域的相关研究及其在多媒体中的应用。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
项亮
2006 年毕业于中国科学技术大学自动化系。保送中国科学院自动化所并获得博士学位。研究方向为机器学习和推荐系统,2009 年曾参加 Netflix Prize 获得第二名,著有《推荐系统实践》一书。且于当年发起创建了 Resys China 推荐系统社区。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
王明轩
中国科学院计算技术研究所获博士学位。目前是字节跳动豆包大语言模型研究团队负责人。在机器翻译领域,发表顶级会议论文50多篇,并多次在WMT国际机器翻译评测比赛中拿到第一。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
严林
研究生毕业于中科院计算所,目前是字节跳动豆包大语言模型 Alignment 团队负责人。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
田值
澳大利亚阿德莱德大学获计算机科学博士,师从沈春华教授。曾获得 2019 年 Google PhD Fellowship。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
王雨轩
俄亥俄州立大学获博士学位,专注于深度学习、语音技术等方向的研究和应用。领导了语音行业多个突破性工作,成果被广泛应用于学界和工业界。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
陈卓
2017年于美国哥伦比亚大学获博士学位,而后在微软担任核心应用科学家。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
李成刚
清华大学机械工程本硕学位。先后担任字节跳动今日头条网页搜索和 TikTok 视频搜索技术负责人,从0到1研发出了字节跳动的搜索系统,在ranking架构和算法、多语言和多模态相关性领域有较大的创新和突破,在中文搜索体验上做到了领先水平。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
冯佳时
中国科技大学获学士学位,新加坡国立大学获博士学位。专注于计算机视觉、机器学习领域的相关研究及其在多媒体中的应用。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
项亮
2006 年毕业于中国科学技术大学自动化系。保送中国科学院自动化所并获得博士学位。研究方向为机器学习和推荐系统,2009 年曾参加 Netflix Prize 获得第二名,著有《推荐系统实践》一书。且于当年发起创建了 Resys China 推荐系统社区。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
王明轩
中国科学院计算技术研究所获博士学位。目前是字节跳动豆包大语言模型研究团队负责人。在机器翻译领域,发表顶级会议论文50多篇,并多次在WMT国际机器翻译评测比赛中拿到第一。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
严林
研究生毕业于中科院计算所,目前是字节跳动豆包大语言模型 Alignment 团队负责人。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
田值
澳大利亚阿德莱德大学获计算机科学博士,师从沈春华教授。曾获得 2019 年 Google PhD Fellowship。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
王雨轩
俄亥俄州立大学获博士学位,专注于深度学习、语音技术等方向的研究和应用。领导了语音行业多个突破性工作,成果被广泛应用于学界和工业界。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
陈卓
2017年于美国哥伦比亚大学获博士学位,而后在微软担任核心应用科学家。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
李成刚
清华大学机械工程本硕学位。先后担任字节跳动今日头条网页搜索和 TikTok 视频搜索技术负责人,从0到1研发出了字节跳动的搜索系统,在ranking架构和算法、多语言和多模态相关性领域有较大的创新和突破,在中文搜索体验上做到了领先水平。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
冯佳时
中国科技大学获学士学位,新加坡国立大学获博士学位。专注于计算机视觉、机器学习领域的相关研究及其在多媒体中的应用。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
目前担任字节跳动豆包大模型视觉基础研究团队负责人,进行视觉和多模态基础模型、AIGC 和 3D 化身/物体重建与生成等方向的前沿研究,并将这些技术进行广泛落地。加入字节跳动之前,任新加坡国立大学 ECE 系助理教授,领导机器学习和计算机视觉研究实验室,指导或共同指导了近 20 名博士生。
了解更多
项亮
2006 年毕业于中国科学技术大学自动化系。保送中国科学院自动化所并获得博士学位。研究方向为机器学习和推荐系统,2009 年曾参加 Netflix Prize 获得第二名,著有《推荐系统实践》一书。且于当年发起创建了 Resys China 推荐系统社区。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
加入字节跳动后在 AILab 研究视频理解,之后担任推荐系统的负责人。2021 年起加入 AML,现为字节跳动 AML 和豆包大模型 Foundation 团队负责人,带领团队进行基础和前沿AI算法和工程技术探索,并把一系列AI产品快速产品化和商业化。
了解更多
王明轩
中国科学院计算技术研究所获博士学位。目前是字节跳动豆包大语言模型研究团队负责人。在机器翻译领域,发表顶级会议论文50多篇,并多次在WMT国际机器翻译评测比赛中拿到第一。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
参与开源了 lightseq、mrasp 等多个项目,已经在行业内广泛使用。同时也长期担任 NeurIPS、ACL、EMNLP 等会议领域主席和赞助主席等。
了解更多
严林
研究生毕业于中科院计算所,目前是字节跳动豆包大语言模型 Alignment 团队负责人。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
Alignment 团队的工作内容包括指令微调(instruction tuning)、奖励模型(reward model)、RLHF、RLAIF 和自学习模型(self-learning model)。同时,我们正在大模型泛化性、可解释性和真实性等关键方向开展一系列前沿且有挑战的研究。
了解更多
田值
澳大利亚阿德莱德大学获计算机科学博士,师从沈春华教授。曾获得 2019 年 Google PhD Fellowship。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
现任字节跳动豆包大模型视觉生成模型技术专家,专注于计算机视觉生成和理解算法。曾经在顶级会议和期刊上发表多篇高引论文。谷歌学术引用量11, 000+次。
了解更多
王雨轩
俄亥俄州立大学获博士学位,专注于深度学习、语音技术等方向的研究和应用。领导了语音行业多个突破性工作,成果被广泛应用于学界和工业界。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
目前担任字节跳动豆包大模型语音部门负责人,带领团队进行多模态生成和理解相关的基础研究和产品化工作。
了解更多
陈卓
2017年于美国哥伦比亚大学获博士学位,而后在微软担任核心应用科学家。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
目前担任字节跳动豆包大模型音频生成研究团队负责人。曾发表100多篇研究论文和专利,推进了多个语音任务的前沿发展,在包括语音生成、识别和翻译,语音分离和增强,说话人识别和日志,语音自监督学习,多通道处理,以及开源语音数据集等方向都做出过突出贡献。
了解更多
李成刚
清华大学机械工程本硕学位。先后担任字节跳动今日头条网页搜索和 TikTok 视频搜索技术负责人,从0到1研发出了字节跳动的搜索系统,在ranking架构和算法、多语言和多模态相关性领域有较大的创新和突破,在中文搜索体验上做到了领先水平。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
目前担任字节跳动豆包大语言模型预训练方向负责人,研究领域包括数据的清洗,合成,配比,关联学习与课程学习,训练算法与scaling capability等。
了解更多
*04
个人成长与回报
充分授权年轻人,高度关注你的成长
/ 提供充足的算力和数据,技术落地场景丰富
/ 深度参与行业顶尖的技术挑战和攻坚课题,有充分的空间探索和创新
/ 高质量的内外部交流分享机会,和行业牛人探讨业界研究趋势
/ 大牛导师带教,一起制定发展目标和培养计划,持续关注你的成长
极具竞争力的薪酬与回报
充分授权年轻人,高度关注你的成长
/ 提供充足的算力和数据,技术落地场景丰富
/ 深度参与行业顶尖的技术挑战和攻坚课题,有充分的空间探索和创新
/ 高质量的内外部交流分享机会,和行业牛人探讨业界研究趋势
/ 大牛导师带教,一起制定发展目标和培养计划,持续关注你的成长
极具竞争力的薪酬与回报
/ 为最顶尖的人才提供行业 Top 薪酬与回报
/ 激励区分度高,让更多优秀的人得到认可
/ 什么时候加入都不晚,与公司共同成长