2024

SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models.

[DOI]

Xiaoxuan Wang

,

Ziniu Hu

,

Pan Lu

,

Yanqiao Zhu

,

Jieyu Zhang

,

Satyen Subramaniam

,

Arjun R. Loomba

,

Shichang Zhang

,

Yizhou Sun

,

Wei Wang

Proceedings of the Forty-first International Conference on Machine Learning, 2024