Baichuan-Omni-1.5 Technical Report.

[DOI]

Yadong Li

,

Jun Liu

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

CoRR, January, 2025

SysBench: Can Large Language Models Follow System Messages?

[DOI]

,

,

,

,

,

,

,

,

,

,

,

CoRR, 2024

MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark.

[DOI]

,

,

,

,

,

,

,

,

,

,

,

,

,

,

CoRR, 2024

CFBench: A Comprehensive Constraints-Following Benchmark for LLMs.

[DOI]

,

,

,

,

,

,

,

,

,

,

,

,

CoRR, 2024

PAS: Data-Efficient Plug-and-Play Prompt Augmentation System.

[DOI]

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

CoRR, 2024