招聘城市:北京
…3.优化大模型推理框架,提升框架易用性和可调试性。
岗位要求:
1.熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm/sglang等深度学习推理框架的实际使用经验;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
岗位介绍:
在腾讯,后台开发工程师不仅是“又…
招聘城市:北京,上海
…训练推理框架研发】
大模型hi lab AI Infra团队专注于大语言模型领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。
1、负责机器学习框架的研究与开发,服务于公司各个产品;
2、高效部署,优化NLP/多模态大模型核心业务模型;
【轻量化】
机器学习系统团队需要将传统或者新型的轻量化算法和工程有机结合起来进行加速,提高大语言模型训练或者推理性能的同时,通过算法手段尽可能降低效果损失。候选人将在以下几个方向进行深入探索和落地:
1、量化方向:负责但不限于大语言模型的低精度训练(FP8)…
招聘城市:北京
…验证,加速前沿大模型对齐算法在微信海量业务场景的规模化落地。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点;
4.综合素质: 具备极强的技术好奇心与自驱力,面对业界无先例的技术难题,能独立思考并推动解决。
岗位介绍:
在腾讯,后台开发工程师不仅是…
招聘城市:广州
…3.与搜索算法团队紧密合作,设计实现高性能的AI搜索大模型,加速最新的大模型技术在搜索场景的落地。
岗位要求:
1.具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的开发和优化经验;
3.熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,有实际开发部署并解决相关问题的经验;
4.熟悉最新的大模型结构,熟悉各种软硬件架构,能够结合具体的模型结构和软硬件架构做训练过程的深度优化。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的…
招聘城市:北京,上海,杭州
…我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地!
1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系;
2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路…
招聘城市:广州
岗位职责:
随着视频号业务发展以及大模型 AI 能力的突破,视频号业务与大模型结合努力尝试,希望在视频创作等场景进行结合落地。为了保证需求快速高质量的迭代,希望邀请热爱技术的你,一起攻克这些难题。
1.为推荐场景提供高性能的可靠特征计算能力;
2.对模型服务性能做极致优化,保证需求的快速迭代和高质量稳定运行;
3.结合业务场景对模型进行管理调度以及针对性优化,提升业务的稳定性;
4.完成内部AI应用研效工具建设,帮助产品迅速落地想法,提升迭代效率。
岗位要求:
1.本科以上学历,计算机相关专业,有2年或以上服务端开发经验;
2.熟练掌握常见的编程语言(如 C++,Python、Java、Go 等),熟练掌握深度学习框架…
招聘城市:北京,上海,杭州
…3.大模型加速算法落地: 探索并落地大语言模型及多模态模型的低比特量化(W8A8/W4A8等)、投机采样、CoT压缩、蒸馏、剪枝等算法,支持各业务大幅降低推理成本。
4.异构计算与底层优化: 主导基于国产异构计算芯片(昇腾 NPU 等)及主流 GPU 的软硬协同优化,负责 AI 框架适配、模型移植、关键算子开发与性能优化,实现高吞吐与低延迟的推理系统。
5.探索 Agentic AI Infra 研发范式: 将 AI 工具深度融入 Infra 开发链路,熟练运用 AI 编程工具进行架构探索、复杂 Debug 与重构,大幅提升 AI Infra 全栈工程的迭代效率。
任职要求:
任职要求:
1.AI 工程范式:熟练使用 Claude Code、Cursor、Codex 等工具,具备成熟的 Agentic Engineering 实践技巧,能够基于 AI 工具进行复杂的系统…
招聘城市:广州
岗位职责:
1.负责多模态大模型(图文、视频)在红点推送、本地生活推荐等业务场景中的技术探索与落地应用,提升内容生成精准度和用户转化效率;
2.结合业务数据特点,优化多模态模型的后训练、领域微调、生成控制等技术,实现文案创意生成、个性化推荐、分发策略联动的闭环优化;
3.深入理解用户行为和场景需求,探索多模态生成模型与推荐系统的深度融合,提升内容触达的实时性和相关性。
岗位要求:
1.计算机科学、人工智能、自然语言处理等相关专业硕士以上学历;
2.熟练掌握大模型训练、微调(如LoRA/P-tuning)、生成控制(如Prompt Engineering、Reward Model)等技术;
3.具备文案生成、推荐系统或大模型应用落地经验者优先。
招聘城市:北京,上海,深圳
…极致优化模型训练和推理的性能。
参与开发Triton,TileLang计算图编译优化或者使用CUDA/cutlass编写高性能算子,将硬件性能压榨到极致,最大化发挥出GPU/NPU/PPU/CPU等异构硬件协同算力。
参与开发/调试用于异构计算全链路的AI编译器,探索基于IR编译优化的片内多部件并行流水线等前沿技术,构建业界影响力。
支撑业界领先的多模态模型在国内最大的生活兴趣社区上落地。
任职要求:
【岗位要求】
1. 有扎实的工程算法基础,精通数据结构和常用算法,熟练掌握各种编译、调试、性能分析工具。
2. 精通C/C++/CUDA/Topscc/AscendC,具备扎实的系统底层能力(内存、并发、网络)。
3. 有大规模分布式系统开发和优化经验;有大模型分布式训练…
招聘城市:成都
…训练方案并评估验证模型;
4.负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座。
岗位要求:
1.计算机科学、数学、统计学、自动化等相关专业本科及以上学历,3年以上相关领域工作经验;
2.熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法;
3.具备大模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州、北京。
岗位介绍:
在腾讯,后台开发工程师不仅是…
招聘城市:北京
…优化LLM,VLM等大模型的推理引擎,构建适合AI Search,智能 Agent相关领域大规落地应用中的推理基础架构;
2.紧跟 LLM Infra 领域的前沿技术演进突破,将合适成果落地于实际应用;
3.与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的大模型。
岗位要求:
1.熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验;
2.熟悉各种主流LLM/VLM的模型结构,具有 vllm/sglang/TRT-llm等推理引擎优化实践经验;
3.熟悉LLM 推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV 缓存优化等);
4.有针对真实场景问题的LLM 模型结构和的设计优化经验。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳…
招聘城市:北京,上海,杭州,深圳
…职责:
工作职责:
1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系;
2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地;
3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率;
4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等;
5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验;
6…
招聘城市:广州
岗位职责:
1.负责视频号直播场景下 AI Agent 系统的架构设计、技术选型与迭代规划;
2.设计高性能、易扩展的的系统架构与上下文交互逻辑,以灵活支持多种 Multi-Agent 协作模式,满足不同业务场景下、各垂类主播的多元需求;
3.结合具体业务需求,对模型效果和算法推理进行优化,包括但不限于上下文学习、SFT、RLHF、DPO、Agentic RL 等;
4.紧跟大模型与智能体的最新落地技术、探索大模型在主播侧业务中的创新应用,持续提升主播的开播体验与创作效率。
岗位要求:
1.计算机科学、人工智能等相关专业本科及以上学历,3 年及以上相关工作经验;
2.有 AI Agent / LLM 应用项目的全流程实战经验,从系统…
招聘城市:北京
…LLM,VLM等大模型的推理引擎,构建适合AI Search,智能 Agent相关领域大规落地应用中的推理基础架构;
3.紧跟 LLM Infra 领域的前沿技术演进突破,将合适成果落地于实际应用;
4.与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的大模型。
岗位要求:
1.岗位要求:;
2.熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验;
3.熟悉各种主流LLM/VLM的模型结构,具有 vllm/sglang/TRT-llm等推理引擎优化实践经验;
4.熟悉LLM 推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV 缓存优化等);
5.有针对真实场景问题的LLM 模型结构和的设计优化经验。
岗位介绍:
在腾讯,后台开发工程师不仅是…
招聘城市:广州
…定制训练方案并评估验证模型;
4.负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座。
岗位要求:
1.计算机科学、数学、统计学、自动化等相关专业本科及以上学历,3年以上相关领域工作经验;
2.熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法;
3.具备大模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州。
岗位介绍:
在腾讯,后台开发工程师不仅是…
招聘城市:上海
…算子及调度优化,推动优化方案工程化落地;
5.跟踪大模型Infra前沿技术,沉淀优化实践经验;参与vLLM、SGLang等开源项目协作,实现内部技术与开源生态双向赋能。
岗位要求:
1.计算机科学、计算机体系结构、软件工程、人工智能等相关专业的博士及优秀硕士;具有大规模分布式训练系统、高性能计算或 MLSys 方向研究与工程背景者优先;
2.深入理解大规模分布式训练系统,熟悉 DeepSpeed、Megatron-LM、PyTorch FSDP 等主流框架原理;熟悉张量并行、流水线并行、序列并行等并行策略;精通 Python 与 C++,熟悉 CUDA 编程及高性能算子开发;在 MLSys、SC、EuroSys、OSDI、ATC 等系统顶会或 CVPR/NeurIPS/ICML 系统方向有相关成果者优先;
3.对底层系统与 AI 交叉方向有…
招聘城市:广州
岗位职责:
1.负责开发模型训练平台,支持超大规模稀疏模型的秒级实时训练与推理;负责开发模型推理平台,支撑数百个模型的复杂环境下的高并发、低延迟、低成本运行和海量资源的实时调度;
2.支撑视频号短视频推荐、直播推荐、红点推荐、图文推荐等大规模、复杂业务矩阵的高效迭代。
岗位要求:
1.计算机相关专业,本科及以上学历,5年及以上工作经验 熟悉 Linux 开发环境、熟悉C/C++编程语言,熟练掌握常用算法和数据结构,有搜索/广告/推荐方向业务开发经验,熟练掌握至少一门脚本语言(shell/python等);
2.熟悉至少一种深度学习相关框架如tensorflow、pytorch等,有底层框架优化且开源经验;具备扎实数学/算法功底,对机器学习、概率统计等算法…
招聘城市:北京
岗位职责:
1.参与开发优化大模型训练框架,支持大规模高效稳定训练;
2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。
岗位要求:
1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向;
3.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
4.对大模型前沿技术比较敏锐者优先;
5.有实际大模型的训练调参和效果评测项目经验的优先;
6.良好的沟通能力、解决问题能力。
招聘城市:深圳
…自动化评测流水线,提升评测效率与研发迭代速度;
4.与算法、产品团队紧密协作,理解评测需求并转化为可落地的技术方案。
岗位要求:
1.本科及以上学历,计算机相关专业,5 年以上后端开发经验;
2.扎实的系统设计能力,有复杂业务系统或平台型产品的架构经验;
3.熟练掌握 Python/Go 等至少一门语言,熟悉常用框架与中间件;
4.熟悉分布式系统、任务调度、消息队列等技术,有高并发系统开发经验;
5.良好的沟通与协作能力,能够推动跨团队合作。
加分项:
1.有 MLOps/LLMOps 平台建设经验,熟悉模型训练、推理、评估等流程;
2.熟悉大模型评测方法论,了解主流 Benchmark 与评估框架;
3.对 AI Infra 领域有热情,关注行业前沿技术发展。
招聘城市:广州
…并落地多模态大模型前沿技术在安全领域的应用,如强化学习对齐、领域知识注入、跨模态信息对齐、持续预训练/后训练等,推动技术创新与业务价值结合。
岗位要求:
1.硕士及以上学历,计算机、人工智能、机器学习等相关专业背景;
2.3年以上大模型或多模态算法研发经验,熟练掌握至少一种主流深度学习框架(PyTorch优先),精通Python编程;有CUDA并行优化或大规模训练经验者优先;
3.具备扎实的数学基础(概率论、线性代数、微积分等),能够将数学工具应用于算法问题求解;对大模型训练、优化与AI安全落地有浓厚兴趣和快速学习能力。
加分项:
1.有内容安全、风险防控、多模态理解(CV+NLP+序列建模)相关项目经验者优先;
2.在AI…