牛大妈在社招职位搜索机器学习 有 1000+ 条结果

小红书 机器学习平台研发工程师 — Java后台开发

全职 北京,上海,深圳
招聘城市:北京,上海,深圳
岗位职责:
【工作职责】
1. 负责公司机器学习平台相关子系统的设计、开发和优化工作,打造易用、稳定、高效的机器学习平台。
2. 负责机器学习全流程的系统优化和迭代,包括:特征工程、工作流编排、资源调度、任务调度、模型管理、推理服务管理等。
3. 设计、开发超大规模机器学习系统,优化现有技术方案,改善系统性能, 提高算法的整体迭代效率。
任职要求:
【任职资格】
1. 熟悉Linux开发环境,具备良好扎实的算法数据结构基础、良好的编程风格和系统设计能力。
2. 优秀的编码能力,熟练掌握Java和其他至少一门语言(如golang、python等)。
3. 熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch )。
4. 有强烈的工作责任心,较好的学习能力、沟通能力。
5. 具备较强的自我驱动力与…
招聘城市:北京
岗位职责:
1.主导万卡级GPU集群的全局资源调度,通过精细化管理和优化策略,显著提升资源利用率,确保离线和在线任务的高效稳定运行;
2.深入优化RDMA高速网络、分布式存储与计算资源的协同调度,有效解决大规模训练任务中的性能瓶颈,提升整体计算效率;
3.基于Kubernetes、Docker等云原生技术,构建高可用调度框架,全面支持分布式训练框架,实现任务编排、容灾与混部能力,并深入K8s调度器、CSI插件及CRD的开发,推动大规模训推技术的实际落地;
4.积极探索混合云、虚拟化、ARM异构计算等前沿方向,不断推动技术与平台能力的升级和创新。
岗位要求:
1.熟练掌握Go/Python/C++至少一门编程语言,精通数据结构和…
招聘城市:北京,上海,杭州
…异构计算资源(GPU / NPU / PPU)下的多租户配额治理、弹性伸缩与碎片优化。
4.AI 前沿技术预研与落地: 持续追踪 AI 基础设施与大模型平台的前沿技术动态,探索并沉淀团队 AI Native 研发最佳实践,将业界领先的 AI 工程架构与实践理念引入团队。
任职要求:
任职要求:
1.AI Native 研发: 具备快速学习能力,熟练且高频地使用主流大模型与 AI 编程辅助工具(如 Claude Code、Cursor、GitHub Copilot 等),能够根据产品逻辑与用户行为,自主完成从架构设计到代码实现的全链路交付。
2.基础技术能力: 计算机/软件工程等相关专业,具备扎实的计算机系统基础,有强烈的全栈开发意愿,熟悉 Go / Python / Java 中的至少一门后端语言,同时熟悉 Vue 3 / TypeScript / HTML…

小红书(xiaohongshu) 大模型推理服务架构工程师-hi lab

全职 北京,上海,广州
招聘城市:北京,上海,广州
岗位职责:
职位描述
团队专注于大模型机器学习系统领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。
1、负责大模型推理服务的研究与开发,服务于公司各个产品;
2、负责端到端解决大模型预训练、微调对齐阶段的工程、算法问题,为结果负责
任职要求:
1、熟练掌握Linux环境下的C/C++、Python语言;
2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯;
3、能够熟练使用至少一种主流的机器学习框架(TensorFlow / PyTorch等),熟悉框架内部实现;
4、熟悉Transformer模型及其应用场景
5、熟悉…
招聘城市:深圳
岗位职责:
1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等;
2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级;
3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。
岗位要求:
1.熟练掌握TensorFlow、Pytorch、deepSpeed等主流深度学习框架中的一种或多种,并有具体的项目应用经验(包括但不限于模型训练优化、模型服务优化等经验);
2.熟练使用Java/Go/Python至少一种编程语言,良好的软件设计和开发能力;
3.具备owner意识,能主动推进项目进展,承担更多责任,具备团队协作意识…

腾讯 机器学习优化专家

全职 深圳
招聘城市:深圳
…在游戏领域落地AI技术,包括模型训练优化以及在线服务性能提升;
2.积极关注AI领域的最新学术和行业进展,持续优化技术方案,并推进工作流程及研究效率的提升。
岗位要求:
1.精通TensorFlow、PyTorch等主流深度学习框架,具备扎实的模型训练、调优及线上部署实践经验;
2.对并行计算、x86、ARM等计算架构具有深入理解;
3.有大型分布式系统的设计、开发及运维的实战经验;
4.优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5.责任心强,良好的业务意识,团队合作能力和沟通协调能力。
加分项:
1.有游戏开发经验;
2.熟悉NLP,CV,语音合成等深度学习算法;
3.有大模型训练,调优,调试经验。
招聘城市:北京

4.定期调研行业趋势与竞品动态,制定产品差异化竞争策略;
5.支持产品运营及市场推广,提升产品影响力并推动规模化落地。
岗位要求:
1.本科及以上学历,计算机、人工智能、数理统计等相关专业优先;
2.5年以上机器学习平台或大模型平台相关产品设计/研发经验;
3.熟悉主流机器学习平台及AI技术栈(传统AI与大模型),掌握数据准备和模型训练/评测/推理的全流程产品及技术细节;熟悉算力调度及资源利用率优化机制;
4.具备优秀的产品规划能力,能独立完成需求分析及原型设计;能够深入理解和精确定义产品概念;
5.逻辑清晰,沟通能力强,具备跨团队协作经验及复杂问题解决能力,抗压能力强。
加分项:
1.在…
招聘城市:北京
岗位职责:
1.主导万卡级GPU集群的全局资源调度,通过精细化管理和优化策略,显著提升资源利用率,确保离线和在线任务的高效稳定运行;
2.深入优化RDMA高速网络、分布式存储与计算资源的协同调度,有效解决大规模训练任务中的性能瓶颈,提升整体计算效率;
3.基于Kubernetes、Docker等云原生技术,构建高可用调度框架,全面支持分布式训练框架,实现任务编排、容灾与混部能力,并深入K8s调度器、CSI插件及CRD的开发,推动大规模训推技术的实际落地;
4.积极探索混合云、虚拟化、ARM异构计算等前沿方向,不断推动技术与平台能力的升级和创新。
岗位要求:
1.熟练掌握Go/Python/C++至少一门编程语言,精通数据结构和…
招聘城市:深圳
岗位职责:
1.负责腾讯混元机器学习平台的设计与开发,包括:性能优化,持续提升训练性能,包括多机多卡大规模训练优化,数据交换优化等;
2.深入理解跟踪业界AIGC动态,优化平台技术方案,提升平台易用性,降低大模型研发门槛,不断推进平台的LLMOps能力升级;
3.积极追踪业内AI动态,优化内部技术方案,改进产品性能,不断推进AI架构升级。
岗位要求:
1.熟练掌握TensorFlow、Pytorch、deepSpeed等主流深度学习框架中的一种或多种,并有具体的项目应用经验(包括但不限于模型训练优化、模型服务优化等经验);
2.熟练使用Java/Go/Python至少一种编程语言,良好的软件设计和开发能力;
3.具备owner意识,能主动推进项目进展,承担更多责任,具备团队协作意识…
招聘城市:深圳
…安全性,改善平台易用性,提高机器学习研发效率
3. 优化平台GPU调度效率,提高资源利用率
4. 追踪前沿动态,优化技术架构,不断推进平台升级
岗位要求:
1. 掌握机器学习基本原理和工程链路,熟悉数据工程、模型训练、模型推理等流程,具有MLOps相关平台实际开发经验,有大规模搜/广/推工程平台研发经验者优先。
2. 具备丰富的分布式系统开发经验,掌握负载均衡、容灾备份、数据库查询优化、缓存、消息队列等技术与系统。
3. 熟练掌握Java/Go/Python至少一种编程语言,具有良好的软件设计、和代码开发能力。
4. 熟悉Spring Boot、VUE、MySQL等框架组件,了解PyTorch/Megatron/VERL等机器学习框架。
6. 良好的沟通和团队协调能力,具备较好的自驱力,学习能力…

小红书(xiaohongshu) 机器学习平台产品经理

全职 北京,上海
招聘城市:北京,上海
岗位职责:
1.负责搜广推领域机器学习平台的产品规划与全生命周期管理(需求调研、方案设计、迭代优先级、上线推广);
2.深入理解公司内部算法、训练引擎和业务需求,抽象通用能力并推动平台化落地;
3.与训练引擎工程师合作,推动训练框架的易用性、性能和稳定性提升;
4.协调跨部门(算法、工程、数据、运维)的资源,确保重点项目按期高质量交付;
5.跟踪业界机器学习平台、训练框架、算力调度等领域的发展趋势,并引入可落地的最佳实践。
任职要求:
1.本科及以上学历,计算机、人工智能、数据科学等相关专业优先;
2.对机器学习训练流程有深入理解,熟悉主流框架(TensorFlow / PyTorch / MXNet / 自研框架等)的基本使用与原理;
3.有与工程…
招聘城市:北京

岗位要求:
1.本科及以上学历,计算机、人工智能等相关专业;
2.3年以上平台型 AI 产品设计、运营、解决方案或算法、研发经验;
3.深入理解机器学习、大模型相关的产品和技术概念;熟悉市场上主流的机器学习或大模型平台产品,能够独立完成大模型的基础精调与部署;
4.具备优秀的需求理解与抽象能力,具有良好的沟通能力,能清晰地向技术及非技术人员讲解产品方案;具备扎实的文档撰写能力;
5.对 AI 事业充满热情,具备较强的抗压能力;具有协同意识及能力,善于协调多方资源达成目标;具有客户服务意识,能在用户需求与产品定位之间寻找最佳平衡。
加分项:
1.在同等条件下,通过腾讯云认证或取得同等…
招聘城市:上海
岗位职责:
1.质量保障体系构建:负责腾讯云海外机器学习平台的质量保障,建立全链路质量风险识别和稳定性保障体系;
2.技术分析与优化:分析平台实现路径,协助研发团队发现质量隐患和性能瓶颈,推动改进措施落地;
3.评测工具开发:建设自动化评测工具/平台,提升评测效率和工程化水平。
岗位要求:
1.学历与基础:计算机或软件相关专业本科及以上学历,扎实的计算机和软件技术基础;
2.编程能力:熟练使用Golang/Python等至少一门主流编程语言;
3.技术领域:熟悉开发者工具、测试技术或云原生技术中的至少一项(如构建工具、自动化测试、云原生架构等);
4.学习能力:具备强烈的学习欲望和自我提升内驱力。
岗位介绍:
在腾讯,优秀的技术…
招聘城市:深圳
岗位职责:
1.负责腾讯大数据、机器学习等平台的前端设计和开发,架构优化;
2.负责前端组件库&工具库构建和优化,devops建设和前沿技术预研,提升团队开发质量和效率;
3.通过前端技术与性能优化,提升WeData/太极等平台的用户体验;
4.与后端团队紧密合作,确保前后端接口的顺畅对接,优化整体系统性能。
岗位要求:
1.精通React/Vue3+TypeScript技术栈,有大型前端项目和复杂组件库开发经验;
2.深入理解Webpack/Vite构建原理,有微前端实战经验;
3.对高并发、高可用、一致性架构有深入的理解与实践经验,具备大型复杂系统变更治理经验;
4.具备PC WEB、移动端Web&小程序开发经验,熟悉各端调试工具与方法,有性能优化实践经验…
招聘城市:上海,北京
…架构设计,优化大模型推理性能,提升吞吐并控制成本;
3、跟踪并研究AI领域前沿技术发展,结合业务需求进行技术预研和落地实践。
任职要求:
1、计算机、自动化、电子信息或相关专业本科及以上学历;
2、熟悉C++/Python等编程语言,深入理解多线程编程、性能优化、分布式系统设计等核心技术;
3、对技术有强烈热情,具备持续学习能力和钻研精神,代码质量意识强,工作态度严谨;
4、具备良好的沟通协作能力和团队精神,有较强的主动性和求知欲。
岗位亮点:
1、负责美团核心搜索推荐系统的技术架构,业务影响力大,成长空间广阔;
2、作为美团大规模的GPU应用场景之一,有机会深入探索异构计算领域的前沿技术,技术成长快。

小红书(xiaohongshu) AI平台高级前端工程师

全职 北京,上海,杭州,深圳
招聘城市:北京,上海,杭州,深圳
…前端系统架构工作经验,熟悉微前端、Serverless等技术。
5. 有开源项目经验,对开源社区有贡献。
任职要求:
任职资格:
1. 本科及以上学历,计算机相关专业,3-5年前端开发经验。
2. 扎实的计算机基础知识,熟悉HTML、CSS、JavaScript等Web标准技术。
3. 精通主流前端框架,如React、Vue等,有实际项目经验。
4. 熟悉前端工程化体系,包括但不限于Webpack、Babel、ESLint等工具。
5. 有良好的系统架构设计能力,能够设计和实现复杂的前端系统。
6. 具备良好的沟通能力和团队协作精神,能够快速适应团队文化和工作节奏。
7. 对用户体验有深刻的理解,能够从用户视角改善平台体验。
8. 有强烈的好奇心,对前沿技术保持敏感,愿意不断学习和尝试新技术。
招聘城市:北京
…前端系统架构工作经验,熟悉微前端、Serverless等技术。
5. 有开源项目经验,对开源社区有贡献。
任职要求:
任职资格:
1. 本科及以上学历,计算机相关专业,3-5年前端开发经验。
2. 扎实的计算机基础知识,熟悉HTML、CSS、JavaScript等Web标准技术。
3. 精通主流前端框架,如React、Vue等,有实际项目经验。
4. 熟悉前端工程化体系,包括但不限于Webpack、Babel、ESLint等工具。
5. 有良好的系统架构设计能力,能够设计和实现复杂的前端系统。
6. 具备良好的沟通能力和团队协作精神,能够快速适应团队文化和工作节奏。
7. 对用户体验有深刻的理解,能够从用户视角改善平台体验。
8. 有强烈的好奇心,对前沿技术保持敏感,愿意不断学习和尝试新技术。
招聘城市:深圳
岗位职责:
1.负责太极机器学习平台产品规划:聚焦平台内机器学习场景下数据处理、模型训练、服务部署等核心环节,了解传统机器学习、大模型等训练框架、推理框架,能主导产品方案设计,了解行业情况;
2.联动多技术团队推进平台落地:协同算法团队、工程团队(框架,算力,调度)、数据团队等,对齐跨团队需求与目标,解决研发过程中的协作问题,保障平台功能及基模训练任务按时高质量交付;
3.驱动平台迭代与体验优化:收集平台内算法、研发团队的使用反馈,结合机器学习技术趋势,制定平台迭代 roadmap,持续优化产品功能,强化太极平台的核心竞争力。
岗位要求:
1.本科及以上学历,3年以上AI模型训练、算法研发类产品工作经验,具备精调、推理、基模…
招聘城市:深圳
岗位职责:
1.负责太极机器学习平台产品规划:聚焦平台内机器学习场景下数据处理、模型训练、服务部署等核心环节,了解传统机器学习、大模型等训练框架、推理框架,能主导产品方案设计,了解行业情况;
2.联动多技术团队推进平台落地:协同算法团队、工程团队(框架,算力,调度)、数据团队等,对齐跨团队需求与目标,解决研发过程中的协作问题,保障平台功能及基模训练任务按时高质量交付;
3.驱动平台迭代与体验优化:收集平台内算法、研发团队的使用反馈,结合机器学习技术趋势,制定平台迭代 roadmap,持续优化产品功能,强化太极平台的核心竞争力。
岗位要求:
1.本科及以上学历,3年以上AI模型训练、算法研发类产品工作经验,具备精调、推理、基模…
招聘城市:北京,深圳
…持续迭代。运用机器学习、因果推断、大模型等技术,对货运场景中的强不确定性、强价格弹性、强动态性进行建模和优化。具体方向包括:需求预测、留存/转化预测、价格弹性建模等定价/营销优化场景和路径规划与时间预估、履约机会成本预测、供需失衡预测等调度优化场景。
2、预测-决策联合优化:推动预测模型与决策模型的深度耦合,通过端到端优化实现业务订单增长和运营效率提升,直接驱动GMV增长和成本优化。
3、业务洞察与技术探索:深入理解无人车货运业务全链路,洞察业务快速发展过程中的关键瓶颈,与产品、运营、工程团队紧密协作,探索AI驱动的新一代物流策略体系。
4、前沿技术落地:关注并引入大模型(LLM/Foundation Model)、强化学习、因果…