招聘城市:北京,上海
…的上下文管理与记忆压缩技术,避免长交互过程中关键信息遗忘,支撑超长序列任务的稳定执行。
2、开放环境动态适应:探索解决真实世界中目标模糊、环境多变、突发干扰下的任务持续执行难题。
3、高效学习范式:研究真实世界开放任务reward以及过程奖励设计方法,为长程任务中间步骤提供有效反馈,解决奖励稀疏问题;研究开放环境下的持续学习方法,避免“灾难性遗忘”,增强智能体在新场景、新任务中的泛化能力。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2、在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
3、具备良好的定义…
招聘城市:北京,上海,深圳
…提升在复杂真实桌面/移动端环境下的任务完成能力。
2、长时序跨应用任务规划与执行:研究Agent在跨小时级、多应用协同的长程数字任务中的持续意图保持、动态重规划与自主纠错能力,解决当前CUA在长交互链中出现的上下文丢失、计划漂移与误差累积问题,使Agent能够自主稳定地完成复杂的端到端工作流。
3、实时流式感知与连续决策:从"处理静态截图"升级到"实时屏幕流+音频流"的连续感知模式,探索Agent在动态变化的数字环境中进行实时状态追踪与即时响应的能力,支撑直播监控、实时协作等需要持续交互的场景。
4、全模态Agent的高效学习范式:探索面向全模态CUA场景的强化学习训练方法…
招聘城市:北京,上海
…具有自主意识。该方向主要研究怎么让深度研究智能体具有自主意识、能够主动挖掘人类的真实意图、主动引导人类进行多轮互动,最终给人伙伴式体验并提升人的认知。
4、智能体学习范式:当前智能体学习范式以RLVR为主,但是RLVR具有奖励稀疏、适用范围有限、训练不稳定和训练成本高等缺点。该方向主要研究方向包括但不限于:熵机制研究、过程奖励模型(PRM)、开放问题rubrics-based RL、credit assignment、Thinking/Tool Call Budget等。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2、在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
3、在程序设计…
招聘城市:北京,上海,深圳
…的语音原生大模型,并将其深度融入Agentic工作流,打造“边听、边想、边说、边做”的新一代语音智能体,推动AI从传统的“级联式语音助手(ASR+LLM+TTS)”走向具备极低延迟、全双工交互与复杂任务执行能力的真实世界数字伙伴。
具体地,我们关注如下研究方向:
1、端到端语音-语言统一建模与理解: 摒弃传统的级联架构,探索将连续的音频流(包含语音、副语言特征、环境音)与离散的文本Token在统一的自回归/非自回归架构下进行联合建模。使Agent能够无损保留语音中的情绪、重音、语速等声学特征,并在极低延迟下实现跨模态的深度语义理解。
2、实时全双工流式交互与动态响应: 研究面向真实对话场景的…
招聘城市:北京,上海
…构造、数据清洗、超参数优化以及 outcome-level / process-level 信号设计,提升模型在开放研究任务中的完成率、事实正确性和稳定性。
5、面向真实 research 任务的评测体系与错误分析闭环建设,建立 benchmark、自动化评测指标,系统分析搜索遗漏、证据误判、上下文污染、推理漂移、错误归因与长链路失稳等问题,并推动针对性优化。
任职要求:
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先;
2、具备扎实的算法和数学理论基础及良好的编程基础,熟悉Python、Java等至少一种编程语言,熟悉PyTorch等深度学习框架;
3、在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
4…
招聘城市:北京
…多模态后训练前沿方法(SFT / DPO / GRPO 等),快速完成技术预研与可行性验证,形成可落地的训练方案并推动模型迭代。
1、面向复杂业务场景(如多轮交互、长序列推理、跨模态 Agent 决策等),进行针对性的垂域数据建设与指令微调,持续提升模型在垂直场景下的表现上限。
2、建设后训练评估体系与数据飞轮,设计面向垂域场景的自动化评测基准,驱动"评测→数据→训练→评测"的闭环迭代。
3、探索多模态大模型与新一代Agent框架(Claude Code、OpenClaw 等)的深度结合,研究模型在工具调用、环境感知、多步规划等场景下的能力边界,推动多模态模型从"被调用"向"自主交互"演进,拓展智能体在真实复杂环境中的落地路径…