基座大模型北斗实习下一代大模型训练范式研究,最近06月03日有更新,美团,2027校招职位,17条信息

美团(meituan) 【基座大模型北斗实习】下一代大模型训练范式研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
岗位职责：
简介：探索下一代大模型训练范式，从模型结构、训练策略、数据策略、算力利用率等角度切入，打造具有更强能力和更高潜力的基座模型
1、设计更高效的模型结构，提高给定数据量、计算量、硬件资源、输出序列长度等约束下的模型能力，如长序列能力、记忆能力等。
2、探索更科学和前沿的训练策略，对影响training dynamic的关键变量（如学习率、batchsize、初始化等）形成更科学的认知，探索diffusion LLM，test-time scaling等技术。
3、研究模型结构和数据的耦合关系，优化分阶段训练范式。
4、结合MLsys解决大规模训练中遇到的卡点问题，实现算法和工程联合设计。
任职要求：
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域，对其中…

美团(meituan) 【基座大模型北斗实习】下一代智能体系统与智能体自进化/持续学习能力研究

2026-04-07 兼职北京，上海

招聘城市：北京，上海
…使模型能主动在重复性任务或封闭任务域中总结、提炼认知与经验，并进行有效复用，达到不断自进化 / 自迭代 / 持续学习的效果。
3、训练智能体系统的系统性长程任务高效处理能力，可以自主进行合理的任务拆解、分工；探索通过 agent swarm 或其他先进的 multi-agent system 进行系统性长程任务的并行执行和提效。
4、探索多模态推理和多模态环境交互的范式，并基于此进行增强智能体系统在复杂全模态环境下的任务完成能力。
任职要求：
1、本科及以上学历，计算机、人工智能、自动化、数学、物理等相关专业在读；
2、在强化学习、文本 / 多模态大模型训练、Agent、世界模型等一个或多个领域有较深入的研究和实践经验…

美团(meituan) 【基座大模型北斗实习】大模型预训练数据科学与模型潜力前沿研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…与模型能力之间的因果联系，打造下一代万亿基座模型的高效数据引擎，致力于提升基座模型的智能上限。研究内容包括但不限于：
1、研发基于模型的高效数据质量评估、去重与清洗算法，提高数据质量、多样性和覆盖度。
2、深入探究数据分布与模型能力的因果关系，建立“训练数据-模型效果”归因机制，探索并突破基座模型的能力上限。
3、探索自动化数据筛选机制、动态配比（Data Mixture）与多阶段训练范式，探索不同类型数据对模型能力的Scaling Law。
4、构建科学、多维度的基座模型能力和潜力评估，驱动预训练数据策略的优化，形成高效的数据迭代闭环。
任职要求：
1、硕士及以上学历，计算机、人工智能、数学、NLP等相关专业，博士优先；
2、在大模型…

美团(meituan) 【基座大模型北斗实习】面向Agentic场景的语音交互大模型前沿研究

2026-04-03 兼职北京，上海，深圳

招聘城市：北京，上海，深圳
…在自然对话中的“听觉注意力”问题。探索支持随时打断（Interruption）、智能插话（Backchanneling）、端点检测（VAD）与即时状态切换的底层模型架构，实现媲美真人的丝滑对话节奏。
3、语音驱动的Agent规划与工具调用（Voice-to-Action）：探索如何将模糊、口语化、包含冗余信息的自然语音指令，直接转化为精准的Agent意图与工具调用（Tool Use/API Call）序列。研究语音模态下的长上下文记忆、多轮语音交互中的意图追踪，以及“边对话边执行任务”的并行处理能力。
4、面向语音Agent的高效对齐与强化学习：探索适用于语音大模型的训练范式与对齐策略。包括但不限于：基于人类偏好的语音强化学习（RLHF for Audio）、语音交互轨迹的大规模构建、针对“对话自然度”与…

美团(meituan) 【基座大模型北斗实习】OpenClaw 智能体研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…个人助理与智能服务三大场景，致力于用 AI Agent 重构人与数据、人与服务的交互方式。
【技术方向】
1、DataAgent 核心基建：攻坚复杂长周期任务的调度架构，解决大规模数据流转下的上下文治理、长期记忆与状态流控难题。
2、BA 场景工具链：构建高扩展性数据处理 Skill 体系与安全高效的代码执行沙盒，支持 Agent 智能调度高并发数据流处理工具。
3、精准营销 Agent：基于海量用户行为数据的宏观统计与微观推理，探索精细化需求理解与大小模型协同的高效系统设计。
4、Skill 体系与模型优化：探索 Skill 的表示、调度与自进化机制；推进 Agentic RL、自适应推理等模型训练与调优工作。
5、智能服务新范式：建立 C 端个人…

美团(meituan) 【基座大模型北斗实习】Agent 学习范式与长时程记忆研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…1、计算机、人工智能、数学、统计学、电子信息或相关专业本科高年级、硕士或博士在读；
2、具备扎实的机器学习基础，对以下至少一个方向有较深入理解： - 大语言模型与后训练 - 强化学习 / Online learning / Bandit / Sequence decision making - Agent / Tool use / Planning / Reasoning - 记忆增强模型 / RAG / 长上下文建模 - Reward modeling / Preference learning / PRM / ORM
3、熟悉 Python，具备较强的工程实现能力，能够独立完成实验、调参与结果分析，并具有一定的大模型训练或推理实践经验；
4、具备较强的论文阅读、问题抽象与实验设计能力，能够围绕一个研究问题提出清晰假设、设计验证方案并推进落地；
5、具备良好的沟通协作能力与研究主动性，能够在不确定性较高的前沿问题中快速学习、持续推进…

美团(meituan) 【基座大模型北斗实习】Agentic Foundation Model 学习范式前沿研究

2026-04-07 兼职北京，上海

招聘城市：北京，上海
…与训练方案，提升模型在多模态交互场景下的原生能力
复杂场景落地：面向 Agent、具身智能等前沿场景，提升模型的多模态指令遵循与复杂任务规划能力
4. 下一代训练范式与前沿技术探索
自进化机制：协同上下游团队，探索模型自进化（Self-evolution）机制，研究RL在Mid-training阶段的应用
能力扩展：研究推理阶段扩展（Test-time Scaling）及全模态链式思维（Omni-modal CoT），推动模型从单纯的“知识记忆”向“深度推理与问题解决”演进
任职要求：
1. 硕士及以上学历，计算机、人工智能、数学、自然语言处理等相关专业，博士优先；
2. 具备扎实的算法和数学理论基础及良好的编程基础，熟悉Python、Java等至少一种编程语言，熟悉PyTorch等深度学习框架；
3. 在大模型…

美团(meituan) 【基座大模型北斗实习】全模态Computer Use Agent前沿研究

2026-04-03 兼职北京，上海，深圳

招聘城市：北京，上海，深圳
…实时协作等需要持续交互的场景。
4、全模态Agent的高效学习范式：探索面向全模态CUA场景的强化学习训练方法，包括但不限于：多模态环境下的奖励建模与过程奖励设计、GUI交互轨迹的大规模RL Scaling、基于环境反馈的自进化与持续学习机制，以及多模态推理与行动的联合优化策略。
任职要求：
1、本科及以上学历，计算机、人工智能、自动化、数学等相关专业在读；
2、在以下一个或多个领域有较深入的研究或实践经验：多模态大模型（MLLM）、强化学习（RL）、Agent系统、GUI Agent / Computer Use、视觉-语言模型、跨模态融合；
3、熟悉Python，具备较强的工程实现能力，有大模型训练或推理实践经验者优先；
4、好奇心驱动，具备出色的…

美团(meituan) 【基座大模型北斗实习】基座大模型-Coding方向

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…构建下一代具有强大代码生成与自主 Agent 能力的基座模型，打造可在真实工程环境中独立运作的 AI 开发者。
岗位职责
1、负责基座大模型在代码生成、代码理解、代码 debug 等方向的能力研究与提升，提升模型在Coding任务中的 Planning、长上下文理解等核心能力。
2、探索模型在 repo 级代码理解、跨文件修改、自主 debug 等复杂任务上的能力边界。
3、参与 Post-training（SFT / RL/ PRM）等 Alignment 方法在 Coding 场景的研究与落地。
任职要求：
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域，对其中一个或多个方向有深入的研究经历，且有相关实际项目经验；
2、熟悉Python等至少一门编程语言，熟悉LINUX环境；
3、熟悉Pytorch、 Megatron、DeepSpeed 等开源训练框架…

美团(meituan) 【北斗】广告大模型应用算法工程师-【多国多语言LLM-based 推搜广告】

2026-06-03 全职北京，上海

招聘城市：北京，上海
…2.多国统一推荐基座模型：探索以LLM为基座，通过多国数据联合训练与国家/文化特征注入，构建可快速适配各国市场的统一推荐模型，降低多国分治的维护成本。
3.跨国冷启动与迁移学习：针对新兴市场数据稀缺问题，研究基于LLM的跨国知识迁移与冷启动方案，提升新市场推荐效果的快速收敛能力。
任职要求：
【任职资格】
必要条件：
2027届本科及以上学历，计算机、人工智能等相关专业，且以下条件至少满足一项：
1.在NLP、IR、RecSys等方向的顶级会议（ACL、EMNLP、SIGIR、KDD、WWW、NeurIPS等）以第一作者身份发表论文（或导师一作，自己为二作）。
2.在Kaggle、ACM-ICPC等顶级大赛上获奖。
3.有大厂实验室的实习经验，或有贡献突出的…

美团(meituan) 【基座大模型北斗实习】OpenClaw 下一代 Agent 前沿技术研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
岗位职责：
简介：参与 OpenClaw 下一代 Agent 方向的前沿研究，可根据个人背景和研究兴趣选择以下方向之一深入推进：
1、Skill 体系建设与演化：探索 Skill 的表示、组织、调度与自进化机制，提升复用性与泛化能力。
2、模型训练与调优：包括 Agentic RL、模型自适应推理等，提升智能体在复杂任务中的规划、工具调用与执行能力。
3、OpenClaw C 端社区探索：用 AI Agent 重新定义人与信息的连接方式，从 0 到 1 构建产品与技术全链路。
4、Agent 框架能力建设：智能体架构优化、推理成本控制、上下文治理、长期记忆与执行效率提升等方向研究
5、其他你坚信路线正确的下一代 Agent 前沿方向。
任职要求：
1、有好奇心，敢想敢做，学习能力强，能…

美团(meituan) 【基座大模型北斗实习】Auto Research & Development Agent研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…简介：研发下一代自动化研究智能体系统，专注于提升模型在长周期、高价值复杂任务中的自主执行能力，减少对人类指导的依赖。
1、自动化研究场景下的大模型能力建设，提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据整合与研究写作等方面的能力。
2、长程任务中的上下文组织与记忆管理，设计优化 context scaling、context compression、memory selection、状态追踪与长期依赖建模，提升模型在复杂研究任务中的上下文利用效率与稳定性。
3、自主研究任务相关环境与自动实验闭环建设，构建 search、browser、retrieval、code execution、verifier 等训练与评测环境，打通训练脚本迭代、实验编排、结果比对、版本保留/回滚与复现验证流程。
4、训练策略…

美团(meituan) 【北斗】大模型算法工程师

2026-06-03 全职北京

招聘城市：北京
…集中精准平衡相关性、多样性与发现感，实现“所想即所得”。
4.引导增长基座：研发下一代搜索引导与推荐算法，通过生成式技术优化搜索前/中的用户路径，提升用户发现价值的效率。探索搜索与推荐的深度融合，利用 AI Agent 能力引导用户决策，实现业务增长与用户体验的协同进化。
5.跨业务 Builder 型组织建设：作为 Builder，构建跨业务（餐饮、医药、即时零售、服务零售、酒旅等）的通用算法框架，确保技术底座能够快速适配不同垂直场景的特性。在毫秒级延迟的严苛约束下，主导大模型在线 Serving 优化，通过蒸馏、量化、缓存等手段实现效果与性能的极致平衡。
任职要求：
【任职资格】
1.有搜索、推荐、NLP相关实习或项目经验；
2.熟悉大模型训练、微调、prompt…

美团(meituan) 【北斗实习】广告大模型应用算法工程师-【广告预估基座模型】

2026-02-06 兼职上海

招聘城市：上海
…
基于用户决策快照的广告预估基座模型
【课题说明】
打造以用户决策过程为核心的下一代广告预估基座模型。课题目标是在美团全域业务（外卖 / 到店 / 酒旅 / 团购等）中，构建一个用于预估任务的「用户决策大模型」，通过拟合用户历史决策时刻的全部上下文信息，学习用户偏好，预测用户下一个时刻的曝光 → 点击 → 浏览 → 加购 → 下单 → 到店 → 评论的全链路多状态、多路径概率。
【建议研究方向】
1.多模态决策场景重建：构建「全域行为快照生成器」，将用户的行为序列，转换为用户每一次决策时刻的多模态、高信息密度的「决策快照」。
2.用户决策基座模型：依托「全域行为快照」，预训练一个统一的用户决策基座模型，在给定任意…

美团(meituan) 【基座大模型北斗实习】具身智能系统与开放物理世界探索能力研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…从多模态大模型基座延伸到具身智能，我们的目标是做到具身智能的“GPT时刻”，具备test-time zero-shot/few-shot的跨本体、跨任务泛化。在这个过程中，我们进行具身智能在泛化能力评测分析和关键迭代路径的探索，包括但不限于：
1、探索激发多模态大模型Training-Free泛化能力的Data-Scaling方案（包括VLA和VA），迁移人类数据到具身本体，包括latent action和unified model等方向。
2、探索通过世界模型作为物理仿真引擎的进阶，兼顾仿真和真机的优点，实现泛化评测、强化学习和多样性数据合成。
3、探索通过环境交互的在线强化学习，涉及仿真环境的搭建、数据合成和真机实验，研究通过自我进化的下一代智能提升的…

美团(meituan) 【基座大模型北斗实习】多模态推理前沿研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
岗位职责：
简介：我们聚焦于多模态推理的前沿探索。你将参与具有前瞻性的研究，并可根据个人背景与兴趣，选择以下任一方向进行深入：
1、下一代多模态推理架构：定义并实现复杂/统一多模态模型的高效推理框架。
2、实时交互演进：针对多模态语音视频流，探索极致的系统级优化。
3、长文本/长视频突破：深入研究长序列下的创新压缩算法与高性能推理加速方案。
任职要求：
1、熟悉大模型推理原理及主流优化技术，拥有扎实的编程能力；
2、对多模态技术发展趋势有独立见解与思考；
3、具备极强的自驱力、创新意识与执行闭环能力；
加分项：
1、在相关领域有研究或项目实践经验；
2、对系统性能优化、压缩算法、实时…

美团(meituan) 【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…探索：
①跟踪前沿 Agent 发展，研究在多智能体协同、自主进化等未来形态下的 Agent 形态和相应的评测基准。
②利用 LLM/Agent-as-a-Judge 的方式，提升自动化评测的准确性与效率。
任职要求：
1、硕士及以上学历，计算机或相关专业，博士优先；
2、在 ML / NLP / RL / CV / Speech 等相关方向有扎实的研究基础，在 ACL / EMNLP / NAACL / NeurIPS / ICML / ICLR / CVPR / ICCV / ICASSP 等顶级会议发表论文者优先；
3、优秀的代码和算法功底，具备工匠精神，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；
4、在大模型领域或强化学习领域，主导过大影响力的项目或论文者优先；
5、出色的问题分析和解决能力，有自主探索、深耕一个领域的决心和定力。

牛大妈在校招职位搜索基座大模型北斗实习下一代大模型训练范式研究 有 17 条结果

牛大妈在校招职位搜索基座大模型北斗实习下一代大模型训练范式研究有 17 条结果