基座大模型北斗实习面向真实世界长程开放任务的智能体研究,04月03日发布,美团,2027校招职位,6条信息

美团(meituan) 【基座大模型北斗实习】面向真实世界长程开放任务的智能体研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…的上下文管理与记忆压缩技术，避免长交互过程中关键信息遗忘，支撑超长序列任务的稳定执行。
2、开放环境动态适应：探索解决真实世界中目标模糊、环境多变、突发干扰下的任务持续执行难题。
3、高效学习范式：研究真实世界开放任务reward以及过程奖励设计方法，为长程任务中间步骤提供有效反馈，解决奖励稀疏问题；研究开放环境下的持续学习方法，避免“灾难性遗忘”，增强智能体在新场景、新任务中的泛化能力。
任职要求：
1、硕士及以上学历，计算机、人工智能、数学、自然语言处理等相关专业，博士优先；
2、在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先；
3、具备良好的定义…

美团(meituan) 【基座大模型北斗实习】全模态Computer Use Agent前沿研究

2026-04-03 兼职北京，上海，深圳

招聘城市：北京，上海，深圳
…提升在复杂真实桌面/移动端环境下的任务完成能力。
2、长时序跨应用任务规划与执行：研究Agent在跨小时级、多应用协同的长程数字任务中的持续意图保持、动态重规划与自主纠错能力，解决当前CUA在长交互链中出现的上下文丢失、计划漂移与误差累积问题，使Agent能够自主稳定地完成复杂的端到端工作流。
3、实时流式感知与连续决策：从"处理静态截图"升级到"实时屏幕流+音频流"的连续感知模式，探索Agent在动态变化的数字环境中进行实时状态追踪与即时响应的能力，支撑直播监控、实时协作等需要持续交互的场景。
4、全模态Agent的高效学习范式：探索面向全模态CUA场景的强化学习训练方法…

美团(meituan) 【基座大模型北斗实习】面向真实世界的全模态搜索智能体前沿研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…具有自主意识。该方向主要研究怎么让深度研究智能体具有自主意识、能够主动挖掘人类的真实意图、主动引导人类进行多轮互动，最终给人伙伴式体验并提升人的认知。
4、智能体学习范式：当前智能体学习范式以RLVR为主，但是RLVR具有奖励稀疏、适用范围有限、训练不稳定和训练成本高等缺点。该方向主要研究方向包括但不限于：熵机制研究、过程奖励模型（PRM）、开放问题rubrics-based RL、credit assignment、Thinking/Tool Call Budget等。
任职要求：
1、硕士及以上学历，计算机、人工智能、数学、自然语言处理等相关专业，博士优先；
2、在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先；
3、在程序设计…

美团(meituan) 【基座大模型北斗实习】面向Agentic场景的语音交互大模型前沿研究

2026-04-03 兼职北京，上海，深圳

招聘城市：北京，上海，深圳
…的语音原生大模型，并将其深度融入Agentic工作流，打造“边听、边想、边说、边做”的新一代语音智能体，推动AI从传统的“级联式语音助手（ASR+LLM+TTS）”走向具备极低延迟、全双工交互与复杂任务执行能力的真实世界数字伙伴。
具体地，我们关注如下研究方向：
1、端到端语音-语言统一建模与理解：摒弃传统的级联架构，探索将连续的音频流（包含语音、副语言特征、环境音）与离散的文本Token在统一的自回归/非自回归架构下进行联合建模。使Agent能够无损保留语音中的情绪、重音、语速等声学特征，并在极低延迟下实现跨模态的深度语义理解。
2、实时全双工流式交互与动态响应：研究面向真实对话场景的…

美团(meituan) 【基座大模型北斗实习】Auto Research & Development Agent研究

2026-04-03 兼职北京，上海

招聘城市：北京，上海
…构造、数据清洗、超参数优化以及 outcome-level / process-level 信号设计，提升模型在开放研究任务中的完成率、事实正确性和稳定性。
5、面向真实 research 任务的评测体系与错误分析闭环建设，建立 benchmark、自动化评测指标，系统分析搜索遗漏、证据误判、上下文污染、推理漂移、错误归因与长链路失稳等问题，并推动针对性优化。
任职要求：
1、硕士及以上学历，计算机、人工智能、数学、自然语言处理等相关专业，博士优先；
2、具备扎实的算法和数学理论基础及良好的编程基础，熟悉Python、Java等至少一种编程语言，熟悉PyTorch等深度学习框架；
3、在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先；
4…

美团(meituan) 【基座大模型北斗实习】多模态后训练及 Agent 能力拓展

2026-04-03 兼职北京

招聘城市：北京
…多模态后训练前沿方法（SFT / DPO / GRPO 等），快速完成技术预研与可行性验证，形成可落地的训练方案并推动模型迭代。
1、面向复杂业务场景（如多轮交互、长序列推理、跨模态 Agent 决策等），进行针对性的垂域数据建设与指令微调，持续提升模型在垂直场景下的表现上限。
2、建设后训练评估体系与数据飞轮，设计面向垂域场景的自动化评测基准，驱动"评测→数据→训练→评测"的闭环迭代。
3、探索多模态大模型与新一代Agent框架（Claude Code、OpenClaw 等）的深度结合，研究模型在工具调用、环境感知、多步规划等场景下的能力边界，推动多模态模型从"被调用"向"自主交互"演进，拓展智能体在真实复杂环境中的落地路径…

牛大妈在校招职位搜索基座大模型北斗实习面向真实世界长程开放任务的智能体研究 有 6 条结果

美团(meituan) 【基座大模型北斗实习】面向真实世界长程开放任务的智能体研究

美团(meituan) 【基座大模型北斗实习】全模态Computer Use Agent前沿研究

美团(meituan) 【基座大模型北斗实习】面向真实世界的全模态搜索智能体前沿研究

美团(meituan) 【基座大模型北斗实习】面向Agentic场景的语音交互大模型前沿研究

美团(meituan) 【基座大模型北斗实习】Auto Research & Development Agent研究

美团(meituan) 【基座大模型北斗实习】多模态后训练及 Agent 能力拓展

牛大妈在校招职位搜索基座大模型北斗实习面向真实世界长程开放任务的智能体研究有 6 条结果