经历
从应用数学到计算医学,一路走来的教育、研究与行业经历。
教育背景
东北大学 Northeastern University
计算医学跨学科博士 · ABD · GPA 4.0/4.0
- 2025 年 8 月通过博士资格考试(candidacy exam),成为博士候选人;2026 年 6 月通过论文开题答辩,进入 ABD(All But Dissertation)阶段,预计 2027 年 6 月毕业。
- 研究方向:多模态临床数据(电子病历、医学影像、临床文本、可穿戴数据)、大语言模型与精准医疗。
宾夕法尼亚大学 University of Pennsylvania
社会政策与数据分析硕士 · GPA 3.86/4.0
2021–2022 学年奖学金;导师:Dr. Li Shen。任佩雷尔曼医学院 Shen Lab(DBEI & PennAITech)研究助理。
南京财经大学
数学与应用数学学士
研究与工作
研究助理
Shen Lab · 宾夕法尼亚大学生物统计、流行病学与信息学系
- 主导 5 项跨学科 AI 研究项目,聚焦大模型微调、评测框架与医疗应用,涵盖疾病检测、可信 AI 与公平性医疗数据分析。
- 研发 MentalGPT,基于 MentalChat16K 微调的大语言模型系统,在 7 项心理健康指标上超越基座模型与基线,由人类专家与 LLM 评审共同评估。
- 以第一作者在 KDD、AMIA、AAIC、IEEE BIBM 等会议及健康信息学期刊发表 6 篇论文,并参与 NeurIPS 合作研究。
研究助理
政治学联合项目 · 宾大 × 哥伦比亚 × 伯克利
- 在 Google Cloud 上构建稳健的机器学习管线,处理多源委内瑞拉政治数据(网络文章、电视广播、音频),数据准备时间由 4 周缩短至 1 周。
- 针对西语政治话语微调 OpenAI Whisper 与 GCP 语音转写模型,优化领域术语识别并适配多变的广播音质。
- 运用基于 Transformer 的 NLP 分析 10 万+ 篇委内瑞拉新闻(2006–2009),量化查韦斯时代不同媒体的政治情感变化。
数据科学实习生
毕马威(KPMG)
- 优化 4 条审计分析 Python 数据管线,错误率降低 30%,每周节省 16 小时。
- 构建自动化报表看板(SQL Server、Python、Power BI),追踪 20+ 项 KPI,一键更新、实时可见。
技能
AI / 机器学习
PyTorch · TensorFlow · 计算机视觉 · 医学影像 · 模型优化 · MLOps
NLP 与大模型
微调(LoRA/QLoRA)· RAG · 提示工程 · Hugging Face · LangChain
编程与数据
Python · SQL · Git · Linux · Docker · AWS · GCP · Apache Spark · ETL
可视化与分析
ArcGIS · Tableau · Power BI · Plotly · R · MATLAB