观点网讯:3月4日,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。
该数据集覆盖285个研究生级学科,包含26529道专业问题,不仅涵盖主流学科,还纳入轻工业、农业、服务科学等长尾学科,填补了长尾知识评估领域的空白。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
观点网讯:3月4日,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。
该数据集覆盖285个研究生级学科,包含26529道专业问题,不仅涵盖主流学科,还纳入轻工业、农业、服务科学等长尾学科,填补了长尾知识评估领域的空白。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。