招聘城市:北京,上海,深圳
岗位职责:
【工作职责】
1. 负责公司机器学习平台相关子系统的设计、开发和优化工作,打造易用、稳定、高效的机器学习平台。
2. 负责机器学习全流程的系统优化和迭代,包括:特征工程、工作流编排、资源调度、任务调度、模型管理、推理服务管理等。
3. 设计、开发超大规模机器学习系统,优化现有技术方案,改善系统性能, 提高算法的整体迭代效率。
任职要求:
【任职资格】
1. 熟悉Linux开发环境,具备良好扎实的算法数据结构基础、良好的编程风格和系统设计能力。
2. 优秀的编码能力,熟练掌握Java和其他至少一门语言(如golang、python等)。
3. 熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch )。
4. 有强烈的工作责任心,较好的学习能力、沟通能力。
5. 具备较强的自我驱动力与…
招聘城市:北京
岗位职责:
1.主导万卡级GPU集群的全局资源调度,通过精细化管理和优化策略,显著提升资源利用率,确保离线和在线任务的高效稳定运行;
2.深入优化RDMA高速网络、分布式存储与计算资源的协同调度,有效解决大规模训练任务中的性能瓶颈,提升整体计算效率;
3.基于Kubernetes、Docker等云原生技术,构建高可用调度框架,全面支持分布式训练框架,实现任务编排、容灾与混部能力,并深入K8s调度器、CSI插件及CRD的开发,推动大规模训推技术的实际落地;
4.积极探索混合云、虚拟化、ARM异构计算等前沿方向,不断推动技术与平台能力的升级和创新。
岗位要求:
1.熟练掌握Go/Python/C++至少一门编程语言,精通数据结构和…
招聘城市:深圳
岗位职责:
1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等;
2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级;
3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。
岗位要求:
1.熟练掌握TensorFlow、Pytorch、deepSpeed等主流深度学习框架中的一种或多种,并有具体的项目应用经验(包括但不限于模型训练优化、模型服务优化等经验);
2.熟练使用Java/Go/Python至少一种编程语言,良好的软件设计和开发能力;
3.具备owner意识,能主动推进项目进展,承担更多责任,具备团队协作意识…
招聘城市:深圳
岗位职责:
1.负责在游戏领域落地AI技术,包括模型训练优化以及在线服务性能提升;
2.积极关注AI领域的最新学术和行业进展,持续优化技术方案,并推进工作流程及研究效率的提升。
岗位要求:
1.精通TensorFlow、PyTorch等主流深度学习框架,具备扎实的模型训练、调优及线上部署实践经验;
2.对并行计算、x86、ARM等计算架构具有深入理解;
3.有大型分布式系统的设计、开发及运维的实战经验;
4.优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5.责任心强,良好的业务意识,团队合作能力和沟通协调能力。
加分项:
1.有游戏开发经验;
2.熟悉NLP,CV,语音合成等深度学习算法;
3.有大模型训练…
招聘城市:北京
…
4.定期调研行业趋势与竞品动态,制定产品差异化竞争策略;
5.支持产品运营及市场推广,提升产品影响力并推动规模化落地。
岗位要求:
1.本科及以上学历,计算机、人工智能、数理统计等相关专业优先;
2.5年以上机器学习平台或大模型平台相关产品设计/研发经验;
3.熟悉主流机器学习平台及AI技术栈(传统AI与大模型),掌握数据准备和模型训练/评测/推理的全流程产品及技术细节;熟悉算力调度及资源利用率优化机制;
4.具备优秀的产品规划能力,能独立完成需求分析及原型设计;能够深入理解和精确定义产品概念;
5.逻辑清晰,沟通能力强,具备跨团队协作经验及复杂问题解决能力,抗压能力强。
加分项:
1.在…
招聘城市:北京
岗位职责:
1.主导万卡级GPU集群的全局资源调度,通过精细化管理和优化策略,显著提升资源利用率,确保离线和在线任务的高效稳定运行;
2.深入优化RDMA高速网络、分布式存储与计算资源的协同调度,有效解决大规模训练任务中的性能瓶颈,提升整体计算效率;
3.基于Kubernetes、Docker等云原生技术,构建高可用调度框架,全面支持分布式训练框架,实现任务编排、容灾与混部能力,并深入K8s调度器、CSI插件及CRD的开发,推动大规模训推技术的实际落地;
4.积极探索混合云、虚拟化、ARM异构计算等前沿方向,不断推动技术与平台能力的升级和创新。
岗位要求:
1.熟练掌握Go/Python/C++至少一门编程语言,精通数据结构和…
招聘城市:深圳
岗位职责:
1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等;
2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级;
3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。
岗位要求:
1.熟练掌握TensorFlow、Pytorch、deepSpeed等主流深度学习框架中的一种或多种,并有具体的项目应用经验(包括但不限于模型训练优化、模型服务优化等经验);
2.熟练使用Java/Go/Python至少一种编程语言,良好的软件设计和开发能力;
3.具备owner意识,能主动推进项目进展,承担更多责任,具备团队协作意识…
招聘城市:深圳
岗位职责:
1. 参与机器学习MLOps平台建设,支持搜索、广告、内容推荐、金融等场景海量机器学习任务的调度与管理
2. 持续提升平台运行稳定性、安全性,改善平台易用性,提高机器学习研发效率
3. 优化平台GPU调度效率,提高资源利用率
4. 追踪前沿动态,优化技术架构,不断推进平台升级
岗位要求:
1. 掌握机器学习基本原理和工程链路,熟悉数据工程、模型训练、模型推理等流程,具有MLOps相关平台实际开发经验,有大规模搜/广/推工程平台研发经验者优先。
2. 具备丰富的分布式系统开发经验,掌握负载均衡、容灾备份、数据库查询优化、缓存、消息队列等技术与系统。
3. 熟练掌握Java/Go/Python至少一种编程语言,具有良好的软件设计、和代码开发能力。
4. 熟悉…
招聘城市:北京,上海
岗位职责:
1.负责搜广推领域机器学习平台的产品规划与全生命周期管理(需求调研、方案设计、迭代优先级、上线推广);
2.深入理解公司内部算法、训练引擎和业务需求,抽象通用能力并推动平台化落地;
3.与训练引擎工程师合作,推动训练框架的易用性、性能和稳定性提升;
4.协调跨部门(算法、工程、数据、运维)的资源,确保重点项目按期高质量交付;
5.跟踪业界机器学习平台、训练框架、算力调度等领域的发展趋势,并引入可落地的最佳实践。
任职要求:
1.本科及以上学历,计算机、人工智能、数据科学等相关专业优先;
2.对机器学习训练流程有深入理解,熟悉主流框架(TensorFlow / PyTorch / MXNet / 自研框架等)的基本使用与原理;
3.有与工程…
招聘城市:北京
…
岗位要求:
1.本科及以上学历,计算机、人工智能等相关专业;
2.3年以上平台型 AI 产品设计、运营、解决方案或算法、研发经验;
3.深入理解机器学习、大模型相关的产品和技术概念;熟悉市场上主流的机器学习或大模型平台产品,能够独立完成大模型的基础精调与部署;
4.具备优秀的需求理解与抽象能力,具有良好的沟通能力,能清晰地向技术及非技术人员讲解产品方案;具备扎实的文档撰写能力;
5.对 AI 事业充满热情,具备较强的抗压能力;具有协同意识及能力,善于协调多方资源达成目标;具有客户服务意识,能在用户需求与产品定位之间寻找最佳平衡。
加分项:
1.在同等条件下,通过腾讯云认证或取得同等…
招聘城市:上海
岗位职责:
1.质量保障体系构建:负责腾讯云海外机器学习平台的质量保障,建立全链路质量风险识别和稳定性保障体系;
2.技术分析与优化:分析平台实现路径,协助研发团队发现质量隐患和性能瓶颈,推动改进措施落地;
3.评测工具开发:建设自动化评测工具/平台,提升评测效率和工程化水平。
岗位要求:
1.学历与基础:计算机或软件相关专业本科及以上学历,扎实的计算机和软件技术基础;
2.编程能力:熟练使用Golang/Python等至少一门主流编程语言;
3.技术领域:熟悉开发者工具、测试技术或云原生技术中的至少一项(如构建工具、自动化测试、云原生架构等);
4.学习能力:具备强烈的学习欲望和自我提升内驱力。
岗位介绍:
在腾讯,优秀的技术…
招聘城市:深圳
岗位职责:
1.负责腾讯大数据、机器学习等平台的前端设计和开发,架构优化;
2.负责前端组件库&工具库构建和优化,devops建设和前沿技术预研,提升团队开发质量和效率;
3.通过前端技术与性能优化,提升WeData/太极等平台的用户体验;
4.与后端团队紧密合作,确保前后端接口的顺畅对接,优化整体系统性能。
岗位要求:
1.精通React/Vue3+TypeScript技术栈,有大型前端项目和复杂组件库开发经验;
2.深入理解Webpack/Vite构建原理,有微前端实战经验;
3.对高并发、高可用、一致性架构有深入的理解与实践经验,具备大型复杂系统变更治理经验;
4.具备PC WEB、移动端Web&小程序开发经验,熟悉各端调试工具与方法,有性能优化实践经验…
招聘城市:上海,北京
部门介绍:
美团核心本地商业下业务研发平台,基于公司“零售+科技”的战略导向,通过从底层架构到应用系统、从软件到硬件、从传统算法到GenAI的全方位技术研究,以及开发、运维、安全等全流程能力建设,致力于推动美团核心本地商业下需求侧与供给侧的数字化和智能化升级,助力业务实现高质量增长,优化用户使用体验,提升商户经营水平,促进行业生态伙伴关系的持续健康发展。团队秉持务实、自驱、开放以及追求卓越的工程师文化,一方面通过系统和技术体系的持续迭代升级,帮助业务高质量增长;另一方面,密切关注前沿技术趋势变化,积极创新技术能力,为业务未来发展创造新的可能性。期待优秀的你加入我们,在夯实…
招聘城市:深圳
岗位职责:
1.负责太极机器学习平台产品规划:聚焦平台内机器学习场景下数据处理、模型训练、服务部署等核心环节,了解传统机器学习、大模型等训练框架、推理框架,能主导产品方案设计,了解行业情况;
2.联动多技术团队推进平台落地:协同算法团队、工程团队(框架,算力,调度)、数据团队等,对齐跨团队需求与目标,解决研发过程中的协作问题,保障平台功能及基模训练任务按时高质量交付;
3.驱动平台迭代与体验优化:收集平台内算法、研发团队的使用反馈,结合机器学习技术趋势,制定平台迭代 roadmap,持续优化产品功能,强化太极平台的核心竞争力。
岗位要求:
1.本科及以上学历,3年以上AI模型训练、算法研发类产品工作经验,具备精调、推理、基模…
招聘城市:深圳
岗位职责:
1.负责太极机器学习平台产品规划:聚焦平台内机器学习场景下数据处理、模型训练、服务部署等核心环节,了解传统机器学习、大模型等训练框架、推理框架,能主导产品方案设计,了解行业情况;
2.联动多技术团队推进平台落地:协同算法团队、工程团队(框架,算力,调度)、数据团队等,对齐跨团队需求与目标,解决研发过程中的协作问题,保障平台功能及基模训练任务按时高质量交付;
3.驱动平台迭代与体验优化:收集平台内算法、研发团队的使用反馈,结合机器学习技术趋势,制定平台迭代 roadmap,持续优化产品功能,强化太极平台的核心竞争力。
岗位要求:
1.本科及以上学历,3年以上AI模型训练、算法研发类产品工作经验,具备精调、推理、基模…
招聘城市:北京,深圳
…依靠视觉、激光等传感器,实时感知预测周围环境,通过高精地图定位和智能决策规划,保证自动配送车全场景即时配送能力。自2020年起,自动配送车已在北京、深圳等多地进入常态化试运营阶段,运营车辆超500台,日均运营超16小时,截止2022年6月,已经累计配送近220万单。
欢迎加入美团无人车团队,与我们一起用科技推动即时零售再升级!
岗位职责:
1、策略算法建模与优化:负责无人车货运业务中核心策略模型的建设和持续迭代。运用机器学习、因果推断、大模型等技术,对货运场景中的强不确定性、强价格弹性、强动态性进行建模和优化。具体方向包括:需求预测、留存/转化预测、价格弹性建模等…
招聘城市:深圳
岗位职责:
1.负责3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化;
2.通过数据并行、模型并行、流水线并行、专家并行等策略的工程实现和性能优化;
3.解决大模型训练中的显存瓶颈、通信延迟和负载均衡等核心计算资源问题;
4.负责多模态RLHF训练与推理平台的实现。
岗位要求:
1.熟悉 GPU 架构 & CUDA 编程、算子融合优化等;
2.熟悉 PyTorch FSDP、DeepSpeed、Megatron-LM 等分布式训练框架,具备大模型多种并行训练策略实战经验;
3.熟悉 vLLM、SGLang 等大模型推理框架,有实际性能调优经验(如 KV Cache 优化、动态批处理、Attention 算子定制等);
4.熟悉大模型强化学习的工程技术,比如 OpenRLHF 框架。
加分项:
1.在知名学术期刊或会议…
招聘城市:广州
…迭代。
岗位要求:
1.计算机相关专业,本科及以上学历,5年及以上工作经验 熟悉 Linux 开发环境、熟悉C/C++编程语言,熟练掌握常用算法和数据结构,有搜索/广告/推荐方向业务开发经验,熟练掌握至少一门脚本语言(shell/python等);
2.熟悉至少一种深度学习相关框架如tensorflow、pytorch等,有底层框架优化且开源经验;具备扎实数学/算法功底,对机器学习、概率统计等算法原理有所了解;
3.有GPU相关优化经验者优先。
加分项:
1.具备扎实的数学和算法功底,对机器学习、概率统计等算法原理有深入了解者优先;
2.有推荐/搜索/广告系统服务架构研发经验者优先;
3.有类ACM/ICPC算法竞赛背景者优先;
4.具备海量数据处理和并行计算开发经验者优先…
招聘城市:深圳
岗位职责:
1.负责微信生态内机器学习基础设施组件的研发与维护,重点包括数据存储类组件(如FeatureKV、WeGraphDB、UnionDB)、向量检索系统(如SimOL)及参数服务器(如WePS)等核心模块的开发;
2.深入分析业务需求,针对性优化组件的查询效率、写入吞吐量及资源利用率,持续提升系统性能表现;
3.通过代码重构、架构改进等方式增强组件的易用性,降低业务接入门槛,同时保障高可用性,确保服务SLA达到99.9%以上;
4.紧密结合微信推荐系统、大语言模型等业务的实际场景,收集用户反馈并迭代组件功能,解决业务落地过程中的技术瓶颈;
5.参与技术方案评审与故障排查,输出高质量的技术文档,沉淀最佳实践经验。
岗位要求:
1.计算机相关…
招聘城市:北京
岗位职责:
1.负责广告训练流程和GPU训练框架的功能迭代和优化;
2.深入参与新模型架构和流程的新技术探索和迭代。
岗位要求:
1.本科及以上学历,计算机相关专业;
2.有扎实的编程功底,熟练使用c++和python语言;
3.熟悉Tensorflow或Pytorch等训练框架;
4.有GPU编程和优化经验,有后台性能分析和优化经验优化;
5.责任心好,良好的团队沟通和协作能力,积极主动,勇于接受挑战,富有创新精神。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多…