牛大妈在社招职位搜索微信-AI Infra工程师-大模型推理方向 有 9 条结果

招聘城市:北京
…sglang等深度学习推理框架的实际使用经验;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨…
招聘城市:北京
…优化LLM,VLM等模型推理引擎,构建适合AI Search,智能 Agent相关领域大规落地应用中的推理基础架构;
2.紧跟 LLM Infra 领域的前沿技术演进突破,将合适成果落地于实际应用;
3.与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的模型
岗位要求:
1.熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验;
2.熟悉各种主流LLM/VLM的模型结构,具有 vllm/sglang/TRT-llm等推理引擎优化实践经验;
3.熟悉LLM 推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV 缓存优化等);
4.有针对真实场景问题的LLM 模型结构和的设计优化经验。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳…
招聘城市:北京
…LLM,VLM等模型推理引擎,构建适合AI Search,智能 Agent相关领域大规落地应用中的推理基础架构;
3.紧跟 LLM Infra 领域的前沿技术演进突破,将合适成果落地于实际应用;
4.与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的模型
岗位要求:
1.岗位要求:;
2.熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验;
3.熟悉各种主流LLM/VLM的模型结构,具有 vllm/sglang/TRT-llm等推理引擎优化实践经验;
4.熟悉LLM 推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV 缓存优化等);
5.有针对真实场景问题的LLM 模型结构和的设计优化经验。
岗位介绍:
在腾讯,后台开发工程不仅是…
招聘城市:北京
…验证,加速前沿模型对齐算法在海量业务场景的规模化落地。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点;
4.综合素质: 具备极强的技术好奇心与自驱力,面对业界无先例的技术难题,能独立思考并推动解决。
岗位介绍:
在腾讯,后台开发工程不仅是…
招聘城市:广州
…和团队协作精神,积极主动,勇于接受挑战。
加分项:
1.在ICPC/CCPC等算法竞赛中取得过良好成绩;
2.熟悉一种以上的模型训练或推理框架,如 Megatron,VeRL、VLLM、SGLang 等,在此之上做过深度的开发/优化;
3.对模型算法有较好的理解,能做算法和工程 co-design 的设计。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
招聘城市:成都
…但不限于RM、PPO、DPO、GRPO等算法;
3.具备模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州、北京。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
招聘城市:广州
…包括但不限于RM、PPO、DPO、GRPO等算法;
3.具备模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
招聘城市:广州
…框架的开发和优化经验;
3.熟悉模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,有实际开发部署并解决相关问题的经验;
4.熟悉最新的模型结构,熟悉各种软硬件架构,能够结合具体的模型结构和软硬件架构做训练过程的深度优化。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
招聘城市:北京
岗位职责:
1.对LLM训练的多方面场景的AI基础设施进行优化。包括但不限于GPU,RDMA,存储等硬件设备,RL/训练算法等技术方向。最终将硬件性能榨干,加速语言模型落地;
2.一个人无法穷尽AI系统的各方面能力。只要有独特经验和独到观点,推进某一个维度优化系统即可;
3.同时希望您认同我们产品优先,乐于挑战的文化,推动AI产品落地过程中AI Infra加速工作。
岗位要求:
1.扎实的编程能力,技术风格以及责任心;
2.具有自我驱动的工作能力,能够持续改进系统不足,提出方案并推动实现。
加分项:
1.对主流开源软件有贡献。
岗位介绍:
在腾讯,后台开发工程不仅是“又快又稳”的问题解决专家,更是生态共创者…