牛大妈在校招职位搜索基座大模型北斗实习面向真实世界的全模态搜索智能体前沿研究 有 6 条结果

招聘城市:北京,上海
…简介:本课题主要聚焦于真实世界中的搜索智能体遇到的实际问题,分别从基础指令遵循、模态扩展、交互形式和学习范式等四个方面进行研究:
1、智能体复杂指令遵循:模型目前已经从实验室走向实际的生产环境,从关注Benchmark指标转为重视实际使用体验。真实使用场景以Train-Free + System Prompt的方式居多,其中System Prompt通常具有指令复杂、组合方式多样、变动频繁等特点。该方向主要研究内容有两点:一是模型对于工具/Skill 调用的指令遵循能力;二是模型对于复杂总结指令的遵循能力。
2、模态深度搜索智能体:最真实的物理世界都是模态的,所以搜索智能体不仅在输入上需要支持模态,而且在整个搜索过程…
招聘城市:北京,上海,深圳
…实时协作等需要持续交互的场景。
4、模态Agent的高效学习范式:探索面向模态CUA场景的强化学习训练方法,包括但不限于:多模态环境下的奖励建模与过程奖励设计、GUI交互轨迹的大规模RL Scaling、基于环境反馈的自进化与持续学习机制,以及多模态推理与行动的联合优化策略。
任职要求:
1、本科及以上学历,计算机、人工智能、自动化、数学等相关专业在读;
2、在以下一个或多个领域有较深入的研究或实践经验:多模态模型(MLLM)、强化学习(RL)、Agent系统、GUI Agent / Computer Use、视觉-语言模型、跨模态融合;
3、熟悉Python,具备较强的工程实现能力,有模型训练或推理实践经验者优先;
4、好奇心驱动,具备出色的…
招聘城市:北京,上海
…的上下文管理与记忆压缩技术,避免长交互过程中关键信息遗忘,支撑超长序列任务的稳定执行。
2、开放环境动态适应:探索解决真实世界中目标模糊、环境多变、突发干扰下的任务持续执行难题。
3、高效学习范式:研究真实世界开放任务reward以及过程奖励设计方法,为长程任务中间步骤提供有效反馈,解决奖励稀疏问题;研究开放环境下的持续学习方法,避免“灾难性遗忘”,增强智能体在新场景、新任务中的泛化能力。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2、在模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
3、具备良好的定义…
招聘城市:北京,上海,深圳
…的语音原生模型,并将其深度融入Agentic工作流,打造“边听、边想、边说、边做”的新一代语音智能体,推动AI从传统的“级联式语音助手(ASR+LLM+TTS)”走向具备极低延迟、全双工交互与复杂任务执行能力的真实世界数字伙伴。
具体地,我们关注如下研究方向:
1、端到端语音-语言统一建模与理解: 摒弃传统的级联架构,探索将连续的音频流(包含语音、副语言特征、环境音)与离散的文本Token在统一的自回归/非自回归架构下进行联合建模。使Agent能够无损保留语音中的情绪、重音、语速等声学特征,并在极低延迟下实现跨模态的深度语义理解。
2、实时全双工流式交互与动态响应: 研究面向真实对话场景的…
招聘城市:北京,上海
…构造、数据清洗、超参数优化以及 outcome-level / process-level 信号设计,提升模型在开放研究任务中的完成率、事实正确性和稳定性。
5、面向真实 research 任务的评测体系与错误分析闭环建设,建立 benchmark、自动化评测指标,系统分析搜索遗漏、证据误判、上下文污染、推理漂移、错误归因与长链路失稳等问题,并推动针对性优化。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2、具备扎实的算法和数学理论基础及良好的编程基础,熟悉Python、Java等至少一种编程语言,熟悉PyTorch等深度学习框架;
3、在模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
4…
招聘城市:北京
…跟踪多模态后训练前沿方法(SFT / DPO / GRPO 等),快速完成技术预研与可行性验证,形成可落地的训练方案并推动模型迭代。
1、面向复杂业务场景(如多轮交互、长序列推理、跨模态 Agent 决策等),进行针对性的垂域数据建设与指令微调,持续提升模型在垂直场景下的表现上限。
2、建设后训练评估体系与数据飞轮,设计面向垂域场景的自动化评测基准,驱动"评测→数据→训练→评测"的闭环迭代。
3、探索多模态模型与新一代Agent框架(Claude Code、OpenClaw 等)的深度结合,研究模型在工具调用、环境感知、多步规划等场景下的能力边界,推动多模态模型从"被调用"向"自主交互"演进,拓展智能体在真实复杂环境中的落地…