招聘城市:深圳
…分布式系统性能优化经验,有大规模集群调优经验者优先;
2.深入理解服务器硬件架构(x86/ARM)、操作系统原理及内核机制(进程调度、内存管理、I/O栈)。熟悉云计算平台的服务器性能优化,或有超算中心调优经验;
3.熟练使用性能分析工具链(如FlameGraph、eBPF、perf、Prometheus)及日志分析系统(ELK Stack);
4.具备脚本开发能力(Python/Shell),熟悉至少一种系统级编程语言(C/C++/Rust);
5.极强的逻辑分析与问题拆解能力,能够从海量数据中定位性能瓶颈。优秀的沟通能力,能清晰传递技术方案并推动跨团队协作。
岗位介绍:
在腾讯,技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题,还是生活与人的问题,腾讯技术人都…
招聘城市:西安
…娱乐等场景的规模化落地。
岗位要求:
1.精通Golang开发,熟悉C/C++、Python等语言,具备3年以上后端开发经验;
2.深入理解Kubernetes架构,有大规模集群管理经验,熟悉容器网络(CNI)、存储(CSI)及调度器扩展开发;
3.熟悉分布式系统设计,掌握微服务、消息队列、服务网格等技术,有高并发系统性能调优经验;
4.对AI大模型的基础架构(如数据并行、模型并行)有基本认知,能理解算法团队的技术需求并提供工程支持;
5.了解AI大模型训练框架(如PyTorch、TensorFlow)、推理加速技术(如Triton)或向量数据库应用优先;
6.熟悉GPU虚拟化、RDMA网络优化或云原生AI平台(如Kubeflow)的开发者优先;
7.了解AI开发全流程(数据准备、训练、部署、监控…
招聘城市:郑州
…日志分析、故障排除、性能调优等工作,保障系统稳定运行与数据安全;配合开发新项目的环境搭建,与相关部门针对具体的技术点进行沟通、提出架构优化方面的意见和建议并推动实施;负责突发事件处理、问题跟踪与解决;负责公司网络、服务器、VMware虚拟化、私有云、公有云、政务云各种云资源的使用维护;负责协助安全工程师完成漏洞修复、软件升级等基础网信安全、数据安全相关工作。■基础能力具有2年以上相关工作经验;掌握Linux安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析以及性能优化;能够熟练配置nginx、tomcat、redis、elk、rocketmq、zk等软件,能够熟练进行集群部署,能够根据实际情况性能调优;熟悉Linux/CentOS/麒麟操作系统,熟悉系统、软件漏洞修复…
招聘城市:上海
…寄存器重用等,将LLM推理性能推向硬件理论极限。
岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.具备5年以上 AI 系统、高性能计算或底层系统开发经验;
3.具备大规模、生产级大语言模型(LLM)在线推理系统从零到一的架构设计与优化实战经验;
4.精通 C++/Python,具备深厚的系统编程功底,对并行计算、内存管理和性能调优有深入的系统性理解;
5.深入理解 Transformer 架构,具备 vLLM, TensorRT-LLM, LightLLM 等主流推理框架的内核级/源码级深度优化经验;对 KV Cache、低比特量化、连续批处理等核心技术有架构决策能力;
6.具备设计和主导实现高并发、超低延迟分布式服务系统的能力;熟悉 Docker/Kubernetes 等云…
招聘城市:上海
…寄存器重用等,将LLM推理性能推向硬件理论极限。
岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.具备5年以上 AI 系统、高性能计算或底层系统开发经验;
3.具备大规模、生产级大语言模型(LLM)在线推理系统从零到一的架构设计与优化实战经验;
4.精通 C++/Python,具备深厚的系统编程功底,对并行计算、内存管理和性能调优有深入的系统性理解;
5.深入理解 Transformer 架构,具备 vLLM, TensorRT-LLM, LightLLM 等主流推理框架的内核级/源码级深度优化经验;对 KV Cache、低比特量化、连续批处理等核心技术有架构决策能力;
6.具备设计和主导实现高并发、超低延迟分布式服务系统的能力;熟悉 Docker/Kubernetes 等云…
招聘城市:深圳
…寄存器重用等,将LLM推理性能推向硬件理论极限。
岗位要求:
1.计算机、人工智能、软件工程等相关专业硕士及以上学历;
2.具备5年以上 AI 系统、高性能计算或底层系统开发经验;
3.具备大规模、生产级大语言模型(LLM)在线推理系统从零到一的架构设计与优化实战经验;
4.精通 C++/Python,具备深厚的系统编程功底,对并行计算、内存管理和性能调优有深入的系统性理解;
5.深入理解 Transformer 架构,具备 vLLM, TensorRT-LLM, LightLLM 等主流推理框架的内核级/源码级深度优化经验;对 KV Cache、低比特量化、连续批处理等核心技术有架构决策能力;
6.具备设计和主导实现高并发、超低延迟分布式服务系统的能力;熟悉 Docker/Kubernetes 等云…
招聘城市:中卫,银川
…3.具备2年以上云业务建设、支撑、运营工作经验;有通信运营商工作经历者优先;4.具备云计算和数据中心工程交付经验,熟悉项目文档管理要求,具备项目过程性文档编制能力,了解云计算和数据中心集成交付流程和技术原理及管理方法等;5.熟练使用一种以上脚本语言,熟悉服务器性能分析和调优,有良好的计算机网络基础;熟悉虚拟化、服务器操作系统、存储,熟悉路由交换、负载均衡、防火墙、中间件等;6.具备DevOps和CI/CD实践经验,了解容器技术和容器编排;有客户现场交付部署经验,有良好用户导向,能与用户建立良好的沟通关系,及时发现客户的需求;7.持有腾讯云、华为云或阿里云等相关认证,具备一定的…
招聘城市:深圳
…服务器网络质量、超节点 AI 集群互联质量,调优网络性能、质量、配置及监控问题;
2.熟悉网络架构和协议,联合服务器网络和交换网络监控进行网络健康分析、完善监控系统;
3.迭代网络硬件固件版本维护,跟进网卡、超节点交换网络 top 问题 fix;
4.编写技术文档、规划服务器网络质量运营。
岗位要求:
1.本科及以上学历,计算机/电子工程专业,5 年以上服务器/网络硬件质量/系统测试经验;
2.扎实 C/shell/python 相关语言基础,能够制定问题复现方案脚本,诊断问题;
3.熟悉网卡多层协议,熟悉拥塞流控等协议,交换网络 L2\RDMA\TCP 等业务功能;
4.熟悉网络硬件演进技术,有网络问题协议分析经验,网络配置、性能、参数排查经验。
加分项:
1.有规模运营服务器…
招聘城市:深圳
…持续改进服务器开发效率和质量。
岗位要求:
1.计算机科学、软件工程或相关专业本科及以上学历;
2.2年以上服务器开发经验,参与过大型多人在线游戏服务器开发经验;
3.精通C++编程语言,具备扎实的数据结构和算法基础;
4.拥有大规模分布式系统设计和开发经验,理解高并发、高可用、可伸缩性架构的挑战和解决方案;
5.熟悉网络编程,包括TCP/UDP、RPC等协议,以及高效的网络通信优化技术(如位级别序列化、增量压缩等);
6.熟悉至少一种关系型数据库(如MySQL、PostgreSQL)和非关系型数据库(如MongoDB、Redis)的设计、优化和维护;
7.熟悉Linux操作系统环境,具备丰富的部署、调试和性能调优经验;
8.具备云平台…
招聘城市:深圳
…GPU异构开发,深入理解CUDA编程模型,能独立完成生成类模型的推理加速或性能调优项目;
2.具备 TensorRT/TensorRT-LLM/FasterTransformer/vllm/sglang 等推理引擎深度实践经验,主导过基于上述引擎的大模型推理系统定制化开发与性能调优;精通推理引擎底层优化技术(算子融合、量化策略、动态批处理、KV 缓存优化);
3.理解生成类模型的核心架构(如扩散模型UNet/Dit结构),熟悉推理过程中的关键性能卡点;
4.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供…
招聘城市:武汉
…腾讯云等基础设施中间件,提升算法快速应用落地能力;
3.参与算法模型部署架构设计,算法服务监控等关键架构问题和技术难题、推动技术革新,系统性能和吞吐调优。
岗位要求:
1.计算机科学、电子信息、自动化、通信工程等信息技术相关专业本科以上学历,2年以上工作经验;
2.熟悉Linux开发环境、熟悉常见的数据结构和算法设计,有微服务化软件基础架构开发及服务器后端系统开发经验;
3.具有扎实的编程基础,熟练掌握Python语言;对于深度学习、LLM大模型部署有强烈兴趣;
4.有较强的Linux程序性能和缺陷诊断和分析的能力;
5.熟悉主流的数据库、缓存、消息队列、分布式框架、分布式存储的工作原理,有运维及性能…
招聘城市:深圳
…效果,基于用户反馈进行模型迭代与性能优化;
6.分享算法设计思路与落地经验,推动团队技术能力的整体提升。
岗位要求:
1.计算机、人工智能、模式识别等相关专业硕士及以上学历,3年以上相关工作经验,有NLP、RL、LLM等领域项目经验者优先;
2.熟练掌握自然语言处理、机器学习、深度学习等相关技术,熟悉主流模型架构(如Transformer、BERT、GPT等)及训练优化方法;
3.具备扎实的算法基础和编码能力,熟练使用Python、C++等编程语言,熟悉PyTorch、TensorFlow等主流深度学习框架;
4.有终端侧模型优化经验(如模型蒸馏、量化、剪枝等)或端云协同推理实践经验者优先;
5.具备较强的问题分析与解决能力,能够独立完成算法设计、实验验证及效果调优…
招聘城市:深圳
…虚拟化方案(如vGPU,MIG,SRIOV,CUDA劫持等)的底层技术原理和实现;
4.有实际的显存/算力超卖,性能监控和调优等方面的相关技术研发经验和项目落地经验;
5.熟悉容器/安全容器领域编排,调度,运行时相关技术栈;
6.熟练掌握Go和Rust中的至少一门语言,以及C/C++语言,具备扎实的系统编程和性能剖析能力;
7.有在大型云厂商从事GPU云服务器或Serverless GPU产品研发的经验;
8.对GPU的硬件复位(GPU Reset)机制,dump/restore等技术有深入研究和实践。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产…
招聘城市:深圳
…提升平台效能,助力业务发展。
部门介绍:
云架构平台部是腾讯规模最大的技术部门之一,为公司各业务提供存储、接入和计算服务。这里有海量的存储平台、世界级的CDN服务、先进的操作系统和视频编解码技术以及自研芯片,我们致力于用技术的力量持续赋能客户,帮助他们提升效率、降低成本。云架构平台部聚焦于规模、产品竞争力、平台能力,通过存储、接入、计算等重点领域的核心技术能力,有力支持和保障腾讯云、自研云等重点业务;同时,部门在各技术领域不断挑战和创造新的记录,视频编码器在MSU国际大赛中一再夺冠、自研芯片性能持续优化助力业务发展、TencentOS深度参与全链路国产化操作系统OpenCloudOS共建,发布自主…
招聘城市:北京
…优化方向;
3.有ViT、SD、DiT模型训练性能优化经验者优先;
4.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
5.对大模型前沿技术比较敏锐者优先;
6.有实际大模型的训练调参和效果评测项目经验的优先;
7.良好的沟通能力、解决问题能力。
部门介绍:
机器学习平台部负责腾讯“太极”机器学习平台的建设,构建面向搜索、广告、推荐的稀疏大模型、大语言模型及稠密大模型和通用机器学习的平台能力,为腾讯广告,微信搜索、社交、游戏、金融、云等多个业务提供易用、高效的一站式机器学习平台服务。我们的技术包括但不限于预训练大模型框架、高性能参数服务器、CPU/GPU 训练和推理加速、图神经网络、NLP…