Huan He, PhD

Research Scientist in Biomedical Informatics and Data Science

DownloadHi-Res Photo

Appointments

Biomedical Informatics & Data Science

Primary

Contact Info

huan.he@yale.edu

About

Titles

Research Scientist in Biomedical Informatics and Data Science

Biography

Dr. Huan He is a Research Scientist in the Section of Biomedical Informatics and Data Science at Yale University School of Medicine. His primary research areas revolve around visual analytics and their applications in healthcare-related research. Currently, his work is focused on designing and developing visual analytics systems using natural language processing (NLP) and machine learning (ML) technologies, with the goal of facilitating data exploration for health-related clinical questions.

Before joining Yale University, Dr. Huan He served as a Research Fellow in the Department of Artificial Intelligence and Informatics at Mayo Clinic Rochester. During his time at Mayo Clinic, he led a living evidence synthesis project aimed at establishing a novel informatics infrastructure for providing living systematic reviews and meta-analyses through data visualization, NLP, and ML techniques. Notably, he contributed to an internal grant that utilized data visualization techniques to present national trends of COVID-19 for community surveillance. He also played a crucial role in the development of an OHNLP text annotation toolkit, which promotes privacy-preserved corpus development through a serverless architecture.

In addition to his research contributions, Dr. Huan He is an active member of the medical informatics and NLP communities. He has been involved in organizing committees for the VAHC workshops and IEEE ICHI conferences. Furthermore, he serves as a regular reviewer for esteemed journals such as JBI, JMIR, TVCJ, and various international conferences, including IEEE VIS, IEEE ICHI, IEEE BIBM, AAAI, and AMIA.

Last Updated on September 13, 2023.

Appointments

Biomedical Informatics & Data Science
Research Scientist
Primary
Biomedical Informatics & Data Science

All Institutions
Biomedical Informatics & Data Science
Clinical NLP Lab

Education & Training

Research Fellow: Mayo Clinic

PhD: Xi'an Jiaotong University, Computer Science

Research

Research at a Glance

Yale Co-Authors

Frequent collaborators of Huan He's published research.

Hua Xu, PhD
View Full Profile
View 2 Common Publications

Publications

Featured Publications

2025

Collaborative large language models for automated data extraction in living systematic reviews
Khan M, Ayub U, Naqvi S, Khakwani K, Sipra Z, Raina A, Zhou S, He H, Saeidi A, Hasan B, Rumble R, Bitterman D, Warner J, Zou J, Tevaarwerk A, Leventakos K, Kehl K, Palmer J, Murad M, Baral C, Riaz I. Collaborative large language models for automated data extraction in living systematic reviews. Journal Of The American Medical Informatics Association 2025, 32: 638-647. PMID: 39836495, PMCID: PMC12005628, DOI: 10.1093/jamia/ocae325.
Peer-Reviewed Original Research
Concepts

2024

2023

See All Publications

ORCID
0000-0003-1312-4195

Academic Achievements & Community Involvement

Get In Touch

Contacts

huan.he@yale.edu

Locations

100 College Street
Academic Office
New Haven, CT 06510
Get Directions

Huan He, PhD

Appointments

Contact Info

About

Titles

Biography

Appointments

Biomedical Informatics & Data Science

Other Departments & Organizations

Education & Training

Research

Research at a Glance

Yale Co-Authors

Publications Timeline

Hua Xu, PhD

Publications

Featured Publications

VUSphere: Visual Analysis of Video Utilization in Online Distance Education

Towards User-centered Corpus Development: Lessons Learnt from Designing and Developing MedTator.

MedTator: A Serverless Web-based Tool for Corpus Annotation

2025

Collaborative large language models for automated data extraction in living systematic reviews

2024

Visual Explanation of the Assessment of Certainty of Evidence for Systematic Review and Meta-analysis

A taxonomy for advancing systematic error analysis in multi-site electronic health record-based clinical concept extraction

2023

An open natural language processing (NLP) framework for EHR-based clinical research: a case demonstration using the National COVID Cohort Collaborative (N3C)

The IMPACT framework and implementation for accessible in silico clinical phenotyping in the digital era

Acquisition of a Lexicon for Family History Information: Bidirectional Encoder Representations From Transformers–Assisted Sublanguage Analysis

ORCID

Academic Achievements & Community Involvement

Get In Touch

Contacts

Locations

100 College Street