招聘城市:北京,上海
岗位职责:
简介:探索下一代大模型训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型
1、设计更高效的模型结构,提高给定数据量、计算量、硬件资源、输出序列长度等约束下的模型能力,如长序列能力、记忆能力等。
2、探索更科学和前沿的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知,探索diffusion LLM,test-time scaling等技术。
3、研究模型结构和数据的耦合关系,优化分阶段训练范式。
4、结合MLsys解决大规模训练中遇到的卡点问题,实现算法和工程联合设计。
任职要求:
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中…
招聘城市:北京,上海
…使模型能主动在重复性任务或封闭任务域中总结、提炼认知与经验,并进行有效复用,达到不断自进化 / 自迭代 / 持续学习的效果。
3、训练智能体系统的系统性长程任务高效处理能力,可以自主进行合理的任务拆解、分工;探索通过 agent swarm 或其他先进的 multi-agent system 进行系统性长程任务的并行执行和提效。
4、探索多模态推理和多模态环境交互的范式,并基于此进行增强智能体系统在复杂全模态环境下的任务完成能力。
任职要求:
1、本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业在读;
2、在强化学习、文本 / 多模态大模型训练、Agent、世界模型等一个或多个领域有较深入的研究和实践经验…
招聘城市:北京,上海
…与模型能力之间的因果联系,打造下一代万亿基座模型的高效数据引擎,致力于提升基座模型的智能上限。研究内容包括但不限于:
1、研发基于模型的高效数据质量评估、去重与清洗算法,提高数据质量、多样性和覆盖度。
2、深入探究数据分布与模型能力的因果关系,建立“训练数据-模型效果”归因机制,探索并突破基座模型的能力上限。
3、探索自动化数据筛选机制、动态配比(Data Mixture)与多阶段训练范式,探索不同类型数据对模型能力的Scaling Law。
4、构建科学、多维度的基座模型能力和潜力评估,驱动预训练数据策略的优化,形成高效的数据迭代闭环。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、NLP等相关专业,博士优先;
2、在大模型…
招聘城市:北京,上海,深圳
…在自然对话中的“听觉注意力”问题。探索支持随时打断(Interruption)、智能插话(Backchanneling)、端点检测(VAD)与即时状态切换的底层模型架构,实现媲美真人的丝滑对话节奏。
3、语音驱动的Agent规划与工具调用(Voice-to-Action): 探索如何将模糊、口语化、包含冗余信息的自然语音指令,直接转化为精准的Agent意图与工具调用(Tool Use/API Call)序列。研究语音模态下的长上下文记忆、多轮语音交互中的意图追踪,以及“边对话边执行任务”的并行处理能力。
4、面向语音Agent的高效对齐与强化学习: 探索适用于语音大模型的训练范式与对齐策略。包括但不限于:基于人类偏好的语音强化学习(RLHF for Audio)、语音交互轨迹的大规模构建、针对“对话自然度”与…
招聘城市:北京,上海
…个人助理与智能服务三大场景,致力于用 AI Agent 重构人与数据、人与服务的交互方式。
【技术方向】
1、DataAgent 核心基建:攻坚复杂长周期任务的调度架构,解决大规模数据流转下的上下文治理、长期记忆与状态流控难题。
2、BA 场景工具链:构建高扩展性数据处理 Skill 体系与安全高效的代码执行沙盒,支持 Agent 智能调度高并发数据流处理工具。
3、精准营销 Agent:基于海量用户行为数据的宏观统计与微观推理,探索精细化需求理解与大小模型协同的高效系统设计。
4、Skill 体系与模型优化:探索 Skill 的表示、调度与自进化机制;推进 Agentic RL、自适应推理等模型训练与调优工作。
5、智能服务新范式:建立 C 端个人…
招聘城市:北京,上海
…1、计算机、人工智能、数学、统计学、电子信息或相关专业本科高年级、硕士或博士在读;
2、具备扎实的机器学习基础,对以下至少一个方向有较深入理解: - 大语言模型与后训练 - 强化学习 / Online learning / Bandit / Sequence decision making - Agent / Tool use / Planning / Reasoning - 记忆增强模型 / RAG / 长上下文建模 - Reward modeling / Preference learning / PRM / ORM
3、熟悉 Python,具备较强的工程实现能力,能够独立完成实验、调参与结果分析,并具有一定的大模型训练或推理实践经验;
4、具备较强的论文阅读、问题抽象与实验设计能力,能够围绕一个研究问题提出清晰假设、设计验证方案并推进落地;
5、具备良好的沟通协作能力与研究主动性,能够在不确定性较高的前沿问题中快速学习、持续推进…
招聘城市:北京,上海
…与训练方案,提升模型在多模态交互场景下的原生能力
复杂场景落地:面向 Agent、具身智能等前沿场景,提升模型的多模态指令遵循与复杂任务规划能力
4. 下一代训练范式与前沿技术探索
自进化机制:协同上下游团队,探索模型自进化(Self-evolution)机制,研究RL在Mid-training阶段的应用
能力扩展:研究推理阶段扩展(Test-time Scaling)及全模态链式思维(Omni-modal CoT),推动模型从单纯的“知识记忆”向“深度推理与问题解决”演进
任职要求:
1. 硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2. 具备扎实的算法和数学理论基础及良好的编程基础,熟悉Python、Java等至少一种编程语言,熟悉PyTorch等深度学习框架;
3. 在大模型…
招聘城市:北京,上海,深圳
…实时协作等需要持续交互的场景。
4、全模态Agent的高效学习范式:探索面向全模态CUA场景的强化学习训练方法,包括但不限于:多模态环境下的奖励建模与过程奖励设计、GUI交互轨迹的大规模RL Scaling、基于环境反馈的自进化与持续学习机制,以及多模态推理与行动的联合优化策略。
任职要求:
1、本科及以上学历,计算机、人工智能、自动化、数学等相关专业在读;
2、在以下一个或多个领域有较深入的研究或实践经验:多模态大模型(MLLM)、强化学习(RL)、Agent系统、GUI Agent / Computer Use、视觉-语言模型、跨模态融合;
3、熟悉Python,具备较强的工程实现能力,有大模型训练或推理实践经验者优先;
4、好奇心驱动,具备出色的…
招聘城市:北京,上海
…构建下一代具有强大代码生成与自主 Agent 能力的基座模型,打造可在真实工程环境中独立运作的 AI 开发者。
岗位职责
1、负责基座大模型在代码生成、代码理解、代码 debug 等方向的能力研究与提升,提升模型在Coding任务中的 Planning、长上下文理解等核心能力。
2、探索模型在 repo 级代码理解、跨文件修改、自主 debug 等复杂任务上的能力边界。
3、参与 Post-training(SFT / RL/ PRM)等 Alignment 方法在 Coding 场景的研究与落地。
任职要求:
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验;
2、熟悉Python等至少一门编程语言,熟悉LINUX环境;
3、熟悉Pytorch、 Megatron、DeepSpeed 等开源训练框架…
招聘城市:北京,上海
…2.多国统一推荐基座模型:探索以LLM为基座,通过多国数据联合训练与国家/文化特征注入,构建可快速适配各国市场的统一推荐模型,降低多国分治的维护成本。
3.跨国冷启动与迁移学习:针对新兴市场数据稀缺问题,研究基于LLM的跨国知识迁移与冷启动方案,提升新市场推荐效果的快速收敛能力。
任职要求:
【任职资格】
必要条件:
2027届本科及以上学历,计算机、人工智能等相关专业,且以下条件至少满足一项:
1.在NLP、IR、RecSys等方向的顶级会议(ACL、EMNLP、SIGIR、KDD、WWW、NeurIPS等)以第一作者身份发表论文(或导师一作,自己为二作)。
2.在Kaggle、ACM-ICPC等顶级大赛上获奖。
3.有大厂实验室的实习经验,或有贡献突出的…
招聘城市:北京,上海
岗位职责:
简介:参与 OpenClaw 下一代 Agent 方向的前沿研究,可根据个人背景和研究兴趣选择以下方向之一深入推进:
1、Skill 体系建设与演化:探索 Skill 的表示、组织、调度与自进化机制,提升复用性与泛化能力。
2、模型训练与调优:包括 Agentic RL、模型自适应推理等,提升智能体在复杂任务中的规划、工具调用与执行能力。
3、OpenClaw C 端社区探索:用 AI Agent 重新定义人与信息的连接方式,从 0 到 1 构建产品与技术全链路。
4、Agent 框架能力建设:智能体架构优化、推理成本控制、上下文治理、长期记忆与执行效率提升等方向研究
5、其他你坚信路线正确的下一代 Agent 前沿方向。
任职要求:
1、有好奇心,敢想敢做,学习能力强,能…
招聘城市:北京,上海
…简介:研发下一代自动化研究智能体系统,专注于提升模型在长周期、高价值复杂任务中的自主执行能力,减少对人类指导的依赖。
1、自动化研究场景下的大模型能力建设,提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据整合与研究写作等方面的能力。
2、长程任务中的上下文组织与记忆管理,设计优化 context scaling、context compression、memory selection、状态追踪与长期依赖建模,提升模型在复杂研究任务中的上下文利用效率与稳定性。
3、自主研究任务相关环境与自动实验闭环建设,构建 search、browser、retrieval、code execution、verifier 等训练与评测环境,打通训练脚本迭代、实验编排、结果比对、版本保留/回滚与复现验证流程。
4、训练策略…
招聘城市:北京
…集中精准平衡相关性、多样性与发现感,实现“所想即所得”。
4.引导增长基座: 研发下一代搜索引导与推荐算法,通过生成式技术优化搜索前/中的用户路径,提升用户发现价值的效率。探索搜索与推荐的深度融合,利用 AI Agent 能力引导用户决策,实现业务增长与用户体验的协同进化。
5.跨业务 Builder 型组织建设:作为 Builder,构建跨业务(餐饮、医药、即时零售、服务零售、酒旅等)的通用算法框架,确保技术底座能够快速适配不同垂直场景的特性。在毫秒级延迟的严苛约束下,主导大模型在线 Serving 优化,通过蒸馏、量化、缓存等手段实现效果与性能的极致平衡。
任职要求:
【任职资格】
1.有搜索、推荐、NLP相关实习或项目经验;
2.熟悉大模型训练、微调、prompt…
招聘城市:上海
…
基于用户决策快照的广告预估基座模型
【课题说明】
打造以用户决策过程为核心的下一代广告预估基座模型。课题目标是在美团全域业务(外卖 / 到店 / 酒旅 / 团购等)中,构建一个用于预估任务的「用户决策大模型」,通过拟合用户历史决策时刻的全部上下文信息,学习用户偏好,预测用户下一个时刻的曝光 → 点击 → 浏览 → 加购 → 下单 → 到店 → 评论的全链路多状态、多路径概率。
【建议研究方向】
1.多模态决策场景重建:构建「全域行为快照生成器」,将用户的行为序列,转换为用户每一次决策时刻的多模态、高信息密度的「决策快照」。
2.用户决策基座模型:依托「全域行为快照」,预训练一个统一的用户决策基座模型,在给定任意…
招聘城市:北京,上海
…从多模态大模型基座延伸到具身智能,我们的目标是做到具身智能的“GPT时刻”,具备test-time zero-shot/few-shot的跨本体、跨任务泛化。在这个过程中,我们进行具身智能在泛化能力评测分析和关键迭代路径的探索,包括但不限于:
1、探索激发多模态大模型Training-Free泛化能力的Data-Scaling方案(包括VLA和VA),迁移人类数据到具身本体,包括latent action和unified model等方向。
2、探索通过世界模型作为物理仿真引擎的进阶,兼顾仿真和真机的优点,实现泛化评测、强化学习和多样性数据合成。
3、探索通过环境交互的在线强化学习,涉及仿真环境的搭建、数据合成和真机实验,研究通过自我进化的下一代智能提升的…
招聘城市:北京,上海
岗位职责:
简介:我们聚焦于多模态推理的前沿探索。你将参与具有前瞻性的研究,并可根据个人背景与兴趣,选择以下任一方向进行深入:
1、下一代多模态推理架构: 定义并实现复杂/统一多模态模型的高效推理框架。
2、实时交互演进: 针对多模态语音视频流,探索极致的系统级优化。
3、长文本/长视频突破: 深入研究长序列下的创新压缩算法与高性能推理加速方案。
任职要求:
1、熟悉大模型推理原理及主流优化技术,拥有扎实的编程能力;
2、对多模态技术发展趋势有独立见解与思考;
3、具备极强的自驱力、创新意识与执行闭环能力;
加分项:
1、在相关领域有研究或项目实践经验;
2、对系统性能优化、压缩算法、实时…
招聘城市:北京,上海
…探索:
①跟踪前沿 Agent 发展,研究在多智能体协同、自主进化等未来形态下的 Agent 形态和相应的评测基准。
②利用 LLM/Agent-as-a-Judge 的方式,提升自动化评测的准确性与效率。
任职要求:
1、硕士及以上学历,计算机或相关专业,博士优先;
2、在 ML / NLP / RL / CV / Speech 等相关方向有扎实的研究基础,在 ACL / EMNLP / NAACL / NeurIPS / ICML / ICLR / CVPR / ICCV / ICASSP 等顶级会议发表论文者优先;
3、优秀的代码和算法功底,具备工匠精神,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
4、在大模型领域或强化学习领域,主导过大影响力的项目或论文者优先;
5、出色的问题分析和解决能力,有自主探索、深耕一个领域的决心和定力。