GinoGino

阅读记录

1 篇文章

【每日一问】如何全面评测大语言模型?
阅读记录

【每日一问】如何全面评测大语言模型?

通过与 ChatGPT 的对话,学习大语言模型的评测方法。从 MMLU、SuperGLUE、HumanEval 等基准测试,到 Chatbot Arena 等评测平台,了解模型评测的基本概念和发展趋势。
3 分钟阅读
Daily ChatLLM EvaluationBenchmark