经历

从应用数学到计算医学,一路走来的教育、研究与行业经历。

教育背景

东北大学 Northeastern University

计算医学跨学科博士 · ABD · GPA 4.0/4.0

2024.09 – 2027.06(预计)
  • 2025 年 8 月通过博士资格考试(candidacy exam),成为博士候选人;2026 年 6 月通过论文开题答辩,进入 ABD(All But Dissertation)阶段,预计 2027 年 6 月毕业。
  • 研究方向:多模态临床数据(电子病历、医学影像、临床文本、可穿戴数据)、大语言模型与精准医疗。

宾夕法尼亚大学 University of Pennsylvania

社会政策与数据分析硕士 · GPA 3.86/4.0

2021.08 – 2023.05

2021–2022 学年奖学金;导师:Dr. Li Shen。任佩雷尔曼医学院 Shen Lab(DBEI & PennAITech)研究助理。

南京财经大学

数学与应用数学学士

2017.09 – 2021.06

研究与工作

研究助理

Shen Lab · 宾夕法尼亚大学生物统计、流行病学与信息学系

2021.12 – 2024.08
  • 主导 5 项跨学科 AI 研究项目,聚焦大模型微调、评测框架与医疗应用,涵盖疾病检测、可信 AI 与公平性医疗数据分析。
  • 研发 MentalGPT,基于 MentalChat16K 微调的大语言模型系统,在 7 项心理健康指标上超越基座模型与基线,由人类专家与 LLM 评审共同评估。
  • 以第一作者在 KDD、AMIA、AAIC、IEEE BIBM 等会议及健康信息学期刊发表 6 篇论文,并参与 NeurIPS 合作研究。

研究助理

政治学联合项目 · 宾大 × 哥伦比亚 × 伯克利

2023.02 – 2023.07
  • 在 Google Cloud 上构建稳健的机器学习管线,处理多源委内瑞拉政治数据(网络文章、电视广播、音频),数据准备时间由 4 周缩短至 1 周。
  • 针对西语政治话语微调 OpenAI Whisper 与 GCP 语音转写模型,优化领域术语识别并适配多变的广播音质。
  • 运用基于 Transformer 的 NLP 分析 10 万+ 篇委内瑞拉新闻(2006–2009),量化查韦斯时代不同媒体的政治情感变化。

数据科学实习生

毕马威(KPMG)

2021.04 – 2021.06
  • 优化 4 条审计分析 Python 数据管线,错误率降低 30%,每周节省 16 小时。
  • 构建自动化报表看板(SQL Server、Python、Power BI),追踪 20+ 项 KPI,一键更新、实时可见。

技能

AI / 机器学习

PyTorch · TensorFlow · 计算机视觉 · 医学影像 · 模型优化 · MLOps

NLP 与大模型

微调(LoRA/QLoRA)· RAG · 提示工程 · Hugging Face · LangChain

编程与数据

Python · SQL · Git · Linux · Docker · AWS · GCP · Apache Spark · ETL

可视化与分析

ArcGIS · Tableau · Power BI · Plotly · R · MATLAB