招聘城市:北京,上海,杭州
岗位职责:
1.负责模型预训练、微调、部署及推理过程中的数据准备、模型和数据加速、数据集存储及管理,为大模型提供高效稳定的多模态数据预处理能力,构建高质量的AI数据迭代链路。
2.探索AI Native的多模数据存储格式,支持AI数据高效存储、读取和分析,提升数据的使用价值。
3.跟进LLM、多模态大模型的前沿发展,探索数据如何更好驱动模型迭代。
任职要求:
1. 本科及以上学历,3年以上AI&Data引擎/数据/存储研发经验
2. 加分项:熟悉大模型技术和产品生态,如Data-Juicer/Ray/Daft/Pytorch/RAG等
3. 熟悉Python/Java,具备优秀的设计与编码能力,针对业务需求与问题,可快速设计与实现解决方案
4. 具备良好的沟通和团队协作…
招聘城市:北京,上海,深圳,杭州
岗位职责:
我们正在建设面向万亿级 Token/日、万卡级异构 GPU 集群的 MaaS 调度系统,目标打造行业领先的大模型推理调度能力。你将负责核心调度系统建设,支撑多类大模型推理负载,通过在线离线混部、弹性调度和异构算力调度,在保障 SLA 的同时提升算力利用率、降低单位 Token 成本,让超大规模 MaaS 推理服务更稳、更快、更省。
工作职责
1、万亿级 Token/日吞吐优化:围绕 QPS、RPM/TPM、并发、Token 吞吐、TTFT、TPOT延迟等指标,优化推理服务整体吞吐和资源效率。
2、在线推理与离线批推混部:在保障在线推理 SLA 的前提下,将批量推理、模型评测、数据生成、异步任务、低优先级推理等离线/准离线负载调度到闲置 GPU 资源…
招聘城市:上海,北京,杭州
岗位职责:
1、预训练:模型架构设计和实现,持续打磨多阶段预训练技巧,结合自动化和人工筛选,持续迭代化数据配比方案(质量、类别分布、难度等),训练全尺寸Dense和MoE模型,以及探索Hybrid架构、Diffusion训练/推理等新一代大模型范式;
2、后训练:SFT数据合成、拒绝采样、数据配比、模型训练,样本级标签体系建设,RL数据合成、Reward Model设计、router replay、RL算法创新,显著提升alignment阶段模型生成能力;
3、数据&评测:持续改进数据体系pipeline,包括:数据收集、清洗、去重和配比等,合成各种高质量agentic/reasoning训练数据,提升模型通用能力;持续完善大模型评估体系和Bench,能有效评估STEM、math、code、知识、指令跟随、多语言等维度能力。
任职要求:
1、背景: 计算机、电子、数学等相关专业…
招聘城市:深圳
岗位职责:
1.多模态模型数据处理:负责游戏研发阶段多模态模型的数据处理, 包括不仅限文档OCR、版面理解、表格/公式识别、图表解析、图片视频解析等核心场景,以业务问题为驱动,持续提升模型效果;
2.数据闭环建设:主导数据优化工作,包括问题样本与难例自动化挖掘、多源异构模型交叉投票标注、视觉渲染闭环质量校验、数据分布结构性优化等,构建高质量、可持续迭代的数据飞轮;
3.专项难题攻关:针对复杂表格、公式、图表、图片、视频等复杂场景,设计并落地专项技术方案,解决解析不全、解析错乱等核心问题;
4.前沿技术转化:持续跟踪多模态大模型前沿进展,结合业务场景完成技术选型与落地验证。
岗位要求:
1.计算机视觉、自然语言处理、机器学习…
招聘城市:北京
岗位职责:
1.负责生成式大模型预训练相关的工作,包括但不限于:大规模模型预训练,长文本预训练,线性模型结构探索;
2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破;
3.探索高效的模型知识嵌入方法以及模型知识在线学习更新;
4.探索文本模型预训练的scaling law,在小规模小成本下更精准地预测大规模训练后的表现。
岗位要求:
1.熟练掌握Python,熟悉Linux环境开发,精通应用深度学习框架TensorFlow或者PyTorch;
2.持续跟进前沿的深度学习技术,了解前沿的深度学习相关算法,熟悉Transformer等模型结构;
3.具备分析问题定义问题和解决问题能力,具备持续的自驱力来面对挑战;
4.有大规模模型预训练…
招聘城市:北京,上海
岗位职责:
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地!
1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等;
2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持…
招聘城市:北京
岗位职责:
1.面向智能座舱场景下多模态大模型的预训练、后训练数据需求,构建自动化、高效率的数据处理管线(涵盖数据抓取、清洗、合成、质量评估与版本管理),优化组件性能,确保稳定性和可扩展性;
2.开发自动化数据处理工具与脚本,优化数据清洗、标注及合成的效率和规模化能力;
3.建立数据质量评估指标体系与自动化检测机制,通过数据实验分析识别样本不足、质量问题、配比不均衡等潜在问题,驱动数据优化并量化数据对模型效果的提升;
4.与算法团队深度协作,理解模型训练需求与业务场景特性,定制数据策略,分析挖掘数据资源,支持模型持续迭代,推动数据驱动的模型性能优化。
岗位要求:
1.计算机科学或相关领域本科及以上…
招聘城市:深圳
岗位职责:
1.多模态模型数据处理:负责游戏运营阶段多模态模型的数据治理与加工,包含但不限于玩家行为,玩家反馈,游戏数据等,设计面向多模态模型的数据清洗、特征提取与格式化方案等,以业务问题为驱动,持续提升模型效果;
2.数据闭环建设:利用运营数据参与构建用户画像,用户偏好,生命周期等特征信息的模型,通过模型的迭代协助游戏项目进行游戏玩法优化及运营策略调整,构建高质量、可持续迭代的数据飞轮;
3.结合游戏业务特点与目标,与多方团队协作,参与并推动模型、数据、策略等场景的应用和优化;
4.负责前瞻探索,积极跟进学术界和工业界的最新动态,优化游戏模型技术方案。
岗位要求:
1.计算机、数学、统计学等…
招聘城市:深圳
岗位职责:
1.构建游戏模型评测体系:通过紧跟先进模型及应用的前沿发展,设计全面、准确的多维度指标,建立覆盖多模态(文本/语音/图像/视频/3D等)生成、多模态理解等全面、多维度的评测体系;
2.构建游戏模型评测流程:协同多方相关团队梳理并构建游戏模型评测流程,定期监控模型效果,分析问题并提供优化方案,把模型评测流程高效落地;
3.积极洞察行业动态:持续完善评测体系、快速反馈行业动态及模型能力,发现行业模型以及应用的前进方向、亮点;
4.结果归因:通过各种数据分析方法,深度分析模型评测结果,为模型的更新调优提供精准的问题分析结论。
岗位要求:
1.计算机等相关专业硕士或以上学历,对大模型和游戏都有深度了解…
招聘城市:深圳
岗位职责:
1.开展VLM在GUI智能体场景下的前沿研究,主导包括数据构造、仿真环境构建、模型后训练(Post-training)等全流程关键技术攻关;
2.深耕AI编程垂直领域,围绕工具调用、自动化测试与流水线优化等方向,进行模型调优与方法创新,探索更高效的智能编程范式;
3.负责上下文压缩与高效推理技术的研究,重点推进Embedding压缩、长上下文优化、多模态信息提取等方向的算法突破与技术落地;
4.追踪学术界与工业界最新进展,保持对NLP、CV、强化学习等领域的前沿敏感度,提出具有前瞻性的研究课题并推动实验验证;
5.参与研究方案设计、技术路线论证与系统架构评审,确保研究方向的合理性、系统的高效性与…
招聘城市:深圳
岗位职责:
1.负责3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化;
2.通过数据并行、模型并行、流水线并行、专家并行等策略的工程实现和性能优化;
3.解决大模型训练中的显存瓶颈、通信延迟和负载均衡等核心计算资源问题;
4.负责多模态RLHF训练与推理平台的实现。
岗位要求:
1.熟悉 GPU 架构 & CUDA 编程、算子融合优化等;
2.熟悉 PyTorch FSDP、DeepSpeed、Megatron-LM 等分布式训练框架,具备大模型多种并行训练策略实战经验;
3.熟悉 vLLM、SGLang 等大模型推理框架,有实际性能调优经验(如 KV Cache 优化、动态批处理、Attention 算子定制等);
4.熟悉大模型强化学习的工程技术,比如 OpenRLHF 框架。
加分项:
1.在知名学术期刊或会议…
招聘城市:深圳
岗位职责:
1.作为模型数据团队的技术负责人,统筹数据治理到模型训练之间的衔接工作,制定数据标准、质量规范和团队技术路线;
2.数据特征算法:负责海量文本&多模态数据(图像,视频,音频,3D)的内容理解(如分类标签体系、embedding表征、Caption生成等),质量检测(低质识别检测、优质美学评价等),去重/聚类分析,数据合成等算法;
3.数据管线建设:负责数据采集、筛选清洗、标注与质量评估管线建设。与模型业务团队紧密配合,充分分析挖掘数据资源,建立自动化数据处理流程与机制,支持模型持续迭代;
4.数据实验分析:对模型训练数据进行详细分析,建立科学数据实验机制,识别样本不足、质量问题、配比不均衡等潜在问题,驱动数据优化提升数据覆盖、质量、多样性需求,最终…
招聘城市:北京
岗位职责:
1.负责生成式大模型预训练相关的工作,包括但不限于:大规模模型预训练,长文本预训练,线性模型结构探索;
2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破;
3.探索高效的模型知识嵌入方法以及模型知识在线学习更新;
4.探索文本模型预训练的scaling law,在小规模小成本下更精准地预测大规模训练后的表现。
岗位要求:
1.熟练掌握Python,熟悉Linux环境开发,精通应用深度学习框架TensorFlow或者PyTorch;
2.持续跟进前沿的深度学习技术,了解前沿的深度学习相关算法,熟悉Transformer等模型结构;
3.具备分析问题定义问题和解决问题能力,具备持续的自驱力来面对挑战;
4.有大规模模型预训练…
招聘城市:深圳
岗位职责:
1.负责大模型标注的全流程管理,高效承接大模型文本、图片、视频等数据标注业务需求,包括但不限于项目规划、需求分析、进度把控、资源协调以及质量保障,确保项目按时交付并达到预期目标;
2.数据质量把控:负责数据质量把控,梳理并分析数据质量的问题,优化质控方案,能够反哺和迭代标注标准,提升标注质量;
3.团队协作:支持项目经理和产研团队的相关工作,理解项目需求、模型表现和相应的数据实验,协同产研提高模型质量。
岗位要求:
1.本科及以上学历,具有3年以上大模型标注相关项目管理经验,国内一线大模型团队经验者优先,计算机、统计学相关专业优先,其他专业领域背景者加分,如数学、英语、金法医…
招聘城市:深圳
岗位职责:
1.数据理解能力:负责研究跨模态统一表征学习算法,实现跨模态/混合模态/指令遵循的高效数据检索、多模态数据分层聚类、数据多样性评估与数据剪枝均衡能力;
2.数据体系建设:参与设计、构建大规模多模态世界知识图谱,支持大模型对领域细粒度知识理解与推理能力;探索知识图谱构建的前沿技术,研究跨模态实体链指、属性/关系挖掘、泛知识挖掘算法;
3.数据应用探索:将各模态大模型训练数据挂载到知识图谱体系中,结合模型评测/实验下钻分析模型训练数据在数量、质量、配比上的问题,驱动知识图谱持续迭代,最终带来大模型生成效果的持续提升。
岗位要求:
1.熟练掌握图片、视频、音频、3D、文本的跨模态数据理解…
招聘城市:广州
岗位职责:
1.负责安全垂类多模态大模型(基模)的研发与迭代,涵盖图片、视频、行为序列、关系特征等模态,构建能深度理解行业规则、违规模式与风险信号的模型,支持高质量内容安全审核和账号风控打击;
2.针对大模型应用行算法优化,包括但不限于数据处理加速、模型训练效率提升、推理速度优化等,确保大模型能够在实际应用场景中有效落地;
3.探索并落地多模态大模型前沿技术在安全领域的应用,如强化学习对齐、领域知识注入、跨模态信息对齐、持续预训练/后训练等,推动技术创新与业务价值结合。
岗位要求:
1.硕士及以上学历,计算机、人工智能、机器学习等相关专业背景;
2.3年以上大模型或多模态算法…
招聘城市:深圳
岗位职责:
1. 参与音频大模型的全流程研发,包括跨模态对齐、多模态理解及生成,涵盖文本和语音等训练数据的清洗和制作、基础模型算法选型与优化,聚焦预训练、监督微调及强化学习等关键环节的技术迭代;
2. 负责语音对话大模型的端到端效果优化,提高在远场、低信噪比、多人、音乐等场景下的理解及生成效果,改善模型在方言、副语言信息等方面的理解能力,加强情感对话能力;
3. 探索多模态模型的理解和生成范式,跟进业界新的多模态大模型结构,从模型效果优化及降低全链路处理延时等多个方面开展前沿性研究及落地工作。
岗位要求:
1. 全日制本科及以上学历,计算机科学与技术、机器…
招聘城市:北京,上海
岗位职责:
1、 深入业务场景,利用全域数据资产和海量多维数据,挖掘DMP标签和特征体系,提升广告模型推荐效果
2、基于全域数据资产和商业化业务场景,挖掘潜力SPU商品,实现精准投放
任职要求:
1、 具备机器学习或者数据挖掘的研究和内容领域的项目经验;熟练掌握分类、聚类、回归等机器学习模型;
2、 对数据驱动业务有兴趣,善于将业务问题拆解为算法问题,有助力业务价值、用户画像的相关经验者优先;
3、 扎实的编程功底,精通Python、Java至少一门语言;有大数据处理经验、分布式算法开发经验者优先;
4、 研究生及以上学历,五年以内数据挖掘、机器学习、大规模数据分析的经验;
5、熟悉Hadoop、Hive、Spark,对数据仓库、特征工程有正确的认识…
招聘城市:广州
岗位职责:
1.负责开发模型训练平台,支持超大规模稀疏模型的秒级实时训练与推理;负责开发模型推理平台,支撑数百个模型的复杂环境下的高并发、低延迟、低成本运行和海量资源的实时调度;
2.支撑视频号短视频推荐、直播推荐、红点推荐、图文推荐等大规模、复杂业务矩阵的高效迭代。
岗位要求:
1.计算机相关专业,本科及以上学历,5年及以上工作经验 熟悉 Linux 开发环境、熟悉C/C++编程语言,熟练掌握常用算法和数据结构,有搜索/广告/推荐方向业务开发经验,熟练掌握至少一门脚本语言(shell/python等);
2.熟悉至少一种深度学习相关框架如tensorflow、pytorch等,有底层框架优化且开源经验;具备扎实数学/算法功底,对机器学习、概率统计等算法…
招聘城市:深圳
岗位职责:
1.深度参与LLM大模型压缩加速方案研究,包括不限于:;
2.投机采样:适配LLM模型架构特性,探索Prefill / RL等场景下优化加速方案;
3.稀疏化:Sparse Attention,KV-Cache压缩,模型结构剪枝等优化技术,协同框架定制化稀疏方案,提升模型推理性能;
4.量化:优化Transformer中 Linear/KV-Cache/Attention量化算法,适配FP8/INT8/NVFP4等量化方案及不同硬件后端。探索极低bit量化训练方案,深度协同硬件联合优化,实现模型体积极致压缩和性能突破,并推动实际业务落地;
5.新技术:聚焦长上下文,多轮对话优化等压缩加速优化技术研究;
6.设计可落地的大模型压缩算法及成本优化方案,助力大模型的性能加速,不限于模型结构/软硬协同优化;
7.分析业务性能…