个人简历
下载 PDF教育 · 研究 · 技能 · 荣誉 · 讲座 · 教学 · 服务
教育背景
石溪大学(Stony Brook University),美国纽约州石溪
计算机工程 博士
2026 年 8 月 - 至今(入学中)
南京大学,中国南京
信息与计算科学 学士(计算机强基计划)
计算机学院
2022 年 9 月 - 2026 年 6 月
通过国家「强基计划」(基础学科招生改革试点)入选,是面向基础学科的精英培养路径。 信息与计算科学(计算机强基计划)由南京大学计算机学院承办,课程与标准计算机科学专业一致。
科研经历
慕尼黑大学(LMU Munich)
研究实习生
导师:Dr. Yao Zhang · 2025 年 11 月 - 至今
- 研究基于细粒度强化学习策略的高级推理 Web Agent
- 为基于 RL 的 Web Agent 系统设计新颖的奖励建模机制
- 探索图像锚定推理与多模态融合
南京大学 KRistal 课题组
研究实习生
导师:赵一铮 副教授 · 2025 年 10 月 - 至今
- 主导关于可微逻辑中模糊算子选择的实证与理论研究,面向神经符号学习
- 第一作者论文已完成;正在投稿
独立研究
研究实习生
导师:Dr. Zhen Han · 2025 年 7 月 - 至今
- 研究面向 LLM 的推理增强奖励模型
- 设计了结合拒绝采样、SFT 和 RL 的可扩展偏好对齐流水线
- 主导推理引导奖励建模的实验(论文撰写中)
UIUC ScaleML Lab
研究实习生
导师:Prof. Tong Zhang · 2025 年 4 月 - 6 月
- 构建了 Lean4/mathlib 与 LLM 的集成原型,在 MiniF2F 上做交互式定理证明
- 设计了带状态验证与闭环精化的交互工作流
- 实现了双向通信流水线 (LLM ↔ Lean4)
华为中央软件院 2012 实验室
研究实习生
主管:桂剑锋 · 2025 年 7 月 - 9 月
- 共同开发用于评估 HarmonyOS 智能体推理与适应性的基准评测系统
- 为 IntelliOS-agent 流水线做出贡献,并将 Python 依赖移植到 HarmonyOS
- 将 HDC 调试流水线与基于 LLM 的推理模块集成
北卡罗来纳州立大学 QUEST Lab
研究实习生
导师:Prof. Yuan Liu · 2024 年 7 月 - 11 月
- 探索面向量子机器学习的量子内存架构
- 提出面向 ML 工作负载的优化计算架构
- 合作撰写了一篇关于量子内存架构的论文(后由其他合作者继续推进)
技能
- 编程: C/C++、Python(主力);Rust、Java、C#、Lean4、Lua
- ML/AI: PyTorch、HuggingFace、FSDP、DeepSpeed、Lean4/mathlib
- 系统: Linux(Arch、Fedora)、HPC 集群与分布式训练环境
- 语言: 中文(母语)、英语(流利,TOEFL 101)、日语(中级,N4,可对话与阅读)、德语(初级,可对话)
荣誉与奖励
- 国家奖学金,中国教育部(2025)— 全国前 0.2% 学生
- 全国一等奖(全国冠军),HITCTF 2025(安天杯)— 全国第 1 名(2025)
- 一等奖,熵密杯密码挑战赛(CACR)(2025)
- 全国三等奖,中国研究生网络安全创新大赛(2024)
- 基础学科特别奖学金 一等奖(两次)(2022-2024)
- 南京大学 优秀学生标兵(2023-2024)
- 省级奖项,中国大学生计算机设计大赛(2023)
特邀讲座
- 用 GRPO 做强化学习:从 PPO 到组相对策略优化,NJU AIA,2026 年
- 从零用 NumPy 搭建神经网络,NJU AIA,2025 年
- 从零用 NumPy 搭建神经网络,NJU AIA,2023 年
教学经历
客座讲席:
- Lean4 与交互式定理证明 · 离散数学,南京大学 · 2026 年 1 月
- 网络安全与攻防技术,南京大学 · 2025 年 12 月
助教:
- 人工智能导论,南京大学(陶烨 高级讲师)· 2026 年春
- 密码学,南京大学(张源 教授)· 2024-2025 年
- 信息与计算科学导论,南京大学(仲盛 教授)· 2023-2024 年
- 离散数学,南京大学(仲盛 教授)· 2023-2024 年
协助批改作业与考试、考试准备、组织每周习题课、为学生提供答疑支持。
领导与服务
- 创始人,南京大学人工智能学社(2023-2025 年)
- 队长,南京大学 Trinity CTF 战队(2024-2026 年)
- 主席,南京大学 计算机学院 学生会(2024-2025 年)