LLaVA: Large Language and Vision Assistant - Microsoft Research: People

Building Next-Gen Multimodal Foundation Models for General-Purpose Assistants

LLaVA is an open-source project, collaborating with research community to advance the state-of-the-art in AI. LLaVA represents the first end-to-end trained large multimodal model (LMM) that achieves impressive chat capabilities mimicking spirits of the multimodal GPT-4. The LLaVA family continues growing to support more modalities, capabilities, applications and beyond.

人数

Open research collaboration across universities in the research community and multiple Microsoft team, pushing the SoTA in new capabilities scale and applications etc.

Hao Cheng

Principal Researcher

詳細はこちら

Michel Galley

Senior Principal Researcher

詳細はこちら

Jianfeng Gao

Distinguished Scientist & Vice President

詳細はこちら

Yong Jae Leeの肖像

Yong Jae Lee

Associate Professor

University of Wisconsin-Madison

詳細はこちら

Lars Liden

Principal Research Software Engineer Manager

詳細はこちら

Haotian Liuの肖像

Haotian Liu

Ph.D. student

University of Wisconsin-Madison

詳細はこちら

Xiaodong Liu

Senior Principal Researcher

詳細はこちら

Yadong Lu

Researcher

Microsoft Azure AI

Tristan Naumann

Principal Researcher

詳細はこちら

Hoifung Poon

General Manager, Health Futures

詳細はこちら

Yelong Shen

Principal Researcher

Microsoft Azure AI

Swadheen Shukla

Principal Program Manager

詳細はこちら

Andrea Tupini

Research Software Engineer

詳細はこちら

Naoto Usuyama

Principal Researcher

詳細はこちら

Cliff Wong

Principal Data Scientist

詳細はこちら

Sheng Zhang

Principal Researcher

詳細はこちら