研究 - 李尚敖

研究

在研项目仅列出研究方向与合作者；在研期间不公开具体内容。

符号计算 × ML 机理

南京大学 KRistal 课题组 · 导师：赵一铮副教授 · 2025 年 10 月 - 至今 · 论文投稿中

AI4Math：数学研究协作平台

微软亚洲研究院 (MSRA) · 导师：周子昱 · 2026 年 3 月 - 至今

基于推理的强化学习 Web Agent

慕尼黑大学 (LMU Munich) · 导师：Dr. Yao Zhang · 2025 年 11 月 - 至今

面向智能体的形式方法 × 世界模型

独立研究 · 合作：Dr. Yao Zhang（LMU Munich）· 2026 年 - 至今

智能体 Harness 机理分析

慕尼黑大学 (LMU Munich) · 导师：Dr. Yao Zhang · 2026 年 - 至今

量子玻色编码 × 注意力机制

独立研究 · 合作：Prof. Yuan Liu（NC State）· 2026 年 - 至今

面向偏好对齐的推理增强奖励模型

独立研究 · 导师：Dr. Zhen Han · 2025 年 7 月 - 至今 · 论文撰写中

基于 LLM 与 Lean4 的交互式定理证明

UIUC ScaleML Lab · 导师：Prof. Tong Zhang · 2025 年 4 - 6 月

问题：LLM 能给出看似合理的证明步骤但缺乏形式化验证，限制了其在数学推理上的可靠性
方法：构建了一个集成 Lean4 与 LLM 的原型，在 MiniF2F 上进行交互式定理证明；带证明状态序列化与闭环精化的双向 (LLM ↔ Lean4) 流水线
成果：可运行原型 + 对常见失败模式（上下文违规、无效步骤建议）的分析，反馈到接口设计

HarmonyOS 智能体基准评测系统

华为 2012 实验室 · 主管：桂剑锋 · 2025 年 7 - 9 月

问题：需要对移动 OS 智能体在多样任务下的推理与适应性进行系统性评测
贡献：共同搭建 IntelliOS-agent 流水线的基准评测基础设施；将 HDC 调试工具与基于 LLM 的推理模块集成，并将 Python 依赖移植到 HarmonyOS
成果：已在华为内部 IntelliOS 项目中部署用于智能体评测

面向机器学习的量子内存架构

北卡罗来纳州立大学 QUEST Lab · 导师：Prof. Yuan Liu · 2024 年 7 - 11 月

机器学习模型中的对抗性后门

南京大学 COSEC 课题组 · 导师：张源教授、仲盛教授 · 2023 年 7 月 - 2024 年 12 月

讲座

客座讲席