在包括MMLUPro、AIME24、MATH500、SciCode、GPQA
.appendQr_wrap{border:1pxs
在包括MMLUPro、AIME24、MATH500、SciCode、GPQA、HLE、LiveCodeBench等在内的12个最具有代表性的评测基准中,取得了全球模型第三、
来自于拉丁美洲