招聘城市:深圳
…AI 相关工作负载的设计与研发,降低用户使用成本;
3.通过优化 AI 部署的计算、网络、存储相关资源,提升训练及推理效率;
4.负责推理稳定性、亲和性调度、推理框架优化、GPU池化等相关工作,降低推理成本,提升推理效率。
岗位要求:
1.本科及以上学历,5年及以上相关工作经验;
2.熟悉Kubernetes生态,对Kubernetes源码有了解,具备 K8s Operator 相关开发经验优先;
3.熟悉 AI 训练、微调、推理等各个环节,熟悉主流大模型推理框架,如triton、vllm、lightllm、ollama、sglang等优先;
4.熟悉GPU、 CUDA 、 RDMA 、 NCCL 等相关技术优先,熟悉KubeFlow 、 Ray等相关框架者优先;
5.熟练掌握Golang语言开发,具备C/C++,Rust, Python, Java, Shell等其他一种或多种语言开发经验。
岗位介绍:
在腾讯,后台开发工程师…
…AI 相关工作负载的设计与研发,降低用户使用成本;
3.通过优化 AI 部署的计算、网络、存储相关资源,提升训练及推理效率;
4.负责推理稳定性、亲和性调度、推理框架优化、GPU池化等相关工作,降低推理成本,提升推理效率。
岗位要求:
1.本科及以上学历,5年及以上相关工作经验;
2.熟悉Kubernetes生态,对Kubernetes源码有了解,具备 K8s Operator 相关开发经验优先;
3.熟悉 AI 训练、微调、推理等各个环节,熟悉主流大模型推理框架,如triton、vllm、lightllm、ollama、sglang等优先;
4.熟悉GPU、 CUDA 、 RDMA 、 NCCL 等相关技术优先,熟悉KubeFlow 、 Ray等相关框架者优先;
5.熟练掌握Golang语言开发,具备C/C++,Rust, Python, Java, Shell等其他一种或多种语言开发经验。
岗位介绍:
在腾讯,后台开发工程师…