OkurAI
Compréhension du langage

MMLU (Massive Multitask Language Understanding)

Test de compréhension du langage sur 57 tâches différentes couvrant les mathématiques, l'histoire, le droit, etc.

Créé: 07/09/2020
Mis à jour: 15/01/2024

Métriques

  • Précision
  • Performance par domaine

Statistiques

Modèles évalués
3
Score moyen
86.4%

Meilleur résultat

Modèle
Claude 3 Opus
Score
86.8%

Classement des modèles

Résultats triés par performance

RangModèleScoreDate
1Claude 3 Opus86.8%04/03/2024
2GPT-486.4%14/03/2023
3Gemini 1.5 Pro85.9%15/02/2024