All the articles with the tag "BIG-Bench".
400人以上の研究者が開発したAI評価ベンチマーク「BIG-Bench」。現在のAIでも解けない204のタスクで、AIの真の限界を測定する革新的な取り組みを解説。