牛大妈在社招职位搜索微信输入法 秒剪-大模型推理优化工程师-NLP 方向 有 7 条结果

招聘城市:北京
…算子融合、显存管理、计算图编译优化、Batching、KVCache管理,打造高效的推理服务架构,结合LLM能力实现业务的高效运转;
3.持续跟进业界最新Infra技术,如高效通信库、量化、稀疏蒸馏等训练部署方案,配合实际业务进行技术预研;
4.结合推理引擎和业务服务,优化动态流量调度、资源管理等结合业务实际情况的后台策略。
岗位要求:
1.具备扎实的编程语言基础,掌握 C++/Python/Golang 至少一门语言,熟悉Linux开发环境;
2.有vllm/sglang/Tensorrt-llm/FasterTransformer等模型推理框架的实际使用经验;
3.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端/手机端AI芯片、GPU加速经验优先;
4.熟悉常用推理加速方法,有超大模型分布式部署经验优先。
加分项:
1.在计算机体系结构、分布…
招聘城市:北京
岗位职责:
1.核心系统开发: 深度参与输入核心业务逻辑的设计与研发,攻坚异构模型调度、高性能检索、多模态数据处理等技术难点;
2.高可用保障: 构建并维护具备高容错能力的分布式后端架构,完善全链路监控、自动化全量/灰度发布及故障自愈机制;
3.模型推理加速: 负责输入模型(LLM)的后端服务部署,针对模型推理的端到端时延(Latency)、系统吞吐量(Throughput)及服务稳定性进行极致优化
4.工程效率提升: 研发自动化数据分析系统与中台工具,通过工程化手段提升策略迭代与模型部署的效率;
5.前沿技术预研: 参与新技术调研以及探索,以及项目特定方向的重点、难点开发工作。
岗位要求:
1.基础扎实…
招聘城市:广州
…CRDT + WebSocket)的架构演进与性能优化
4.负责业务 API 服务(Go/Node.js)的设计与开发,涵盖认证鉴权、服务发现、数据持久化等基础能力;
5.参与分布式系统架构设计,包括多副本一致性、消息总线、调度系统等。
岗位要求:
1.本科及以上学历,计算机相关专业;
2.熟悉 Go 或 c++ 或者 Node.js/TypeScript,有服务端开发经验;
3.了解模型(LLM)应用开发范式,熟悉 Function Calling / Agent / RAG 等常见模式,有实际落地经验者优先;
4.熟悉至少一种主流数据库(PostgreSQL / MySQL)及缓存系统(Redis),具备数据建模与查询优化能力;
5.熟悉分布式系统基本原理,有高并发服务、实时通信(WebSocket/SSE)、CRDT/协同编辑相关经验者优先;
6.有 AI Infra 或 MLOps 相关经验(模型网关、推理服务…
招聘城市:北京
岗位职责:
1.评测体系建设:负责语言模型(LLM)及多模态模型(语音/视频/图片)的评测体系设计与搭建;
2.评测方案设计与执行: 构建自动化、可扩展的评测工具链,支持模型快速迭代验证。探索前沿评测方法,包括但不限于 LLM-as-a-Judge、动态评测、Arena 对战、复杂推理评估等;
3.模型能力诊断与优化协同:通过量化分析定位模型短板,与算法团队紧密协作,推动模型能力持续提升。
岗位要求:
1.计算机科学、人工智能、数学、统计学等相关专业硕士及以上学历;
2.精通 Python,熟悉 PyTorch/HuggingFace 生态。深入理解 Transformer 架构及模型训练流程(预训练、SFT、RLHF/DPO);
3.熟悉主流评测框架(如 OpenCompass、lm-evaluation-harness、HF Evaluate 等)及常用指标(BLEU、ROUGE、Pass@k、ELO 等);
4…
招聘城市:北京
岗位职责:
1.负责输入 NLP 模型的 SFT、RL 等核心训练数据集的构建与策略优化,持续提升数据质量;
2.负责多模态理解和多模态生成模型数据构建,包括但不限于视频理解、文生图、视频生成等方向,参与 AIGC 多样性数据集的构建与优化
3.负责搭建模型效果评测体系,设计评测维度、构建评测基准,并深入分析 Bad Case 以驱动模型迭代。
岗位要求:
1.具备NLP或多模态领域算法基础,能深刻理解模型工作原理;
2.具备优秀的数据分析与处理能力,对数据敏感,能针对不同模型特点制定数据策略;
3.熟练使用 Python 及 Pandas、NumPy、Spark 等数据处理工具;熟悉 PyTorch 或 TensorFlow 者优先;
4.具备…
招聘城市:北京
岗位职责:
1.负责读书、输入等产品的模型相关技术的研究与开发,包括但不限于 Agent、RL、跨模态对齐、LongContext 等,研发业界领先的垂类模型
2.持续跟进业界最新的模型算法进展,参与垂类模型的设计、训练、调优以及评测工作,并且推进其在业务中的应用落地。
岗位要求:
1.计算机科学、机器学习、人工智能等相关专业,硕士及以上学历;
2.在模型领域有多个研究成果或落地成果;
3.熟悉各种深度学习框架,如 TensorFlow 或 PyTorch;了解分布式训练框架,如 DeepSpeed 或 Meatorn-LM 等,并有一定的多机多卡分布式训练经验;
4.有较强的工程实现能力者优先;
5…
招聘城市:广州
岗位职责:
1.结合前沿技术发展趋势,探索AI在视频生成/阅读消费/内容创作/输入等场景的创新落地方案;
2.洞察挖掘用户对AI的真实需求和具体场景,设计解决方案并落地;
3.结合目标定义模型效果标准,协同研发、设计同学进行评测和效果优化
岗位要求:
1.超强的学习能力,强烈的好奇心和探索欲,不做好不罢休的胜负欲;
2.有C端AI 相关产品经验,对AI行业趋势和模型技术有深刻理解和热情;
3.具备极强的用户思维和数据分析能力,能精准理解用户需求并利用数据驱动决策;
4.内容感受力强,能结合需求场景,为模型制定任务目标和效果标准。
岗位介绍:
“用户为本,科技向善”,是写在每位腾讯产品…