发布日期:2025-09-05 13:36 点击次数:156
近日,笔据SuperCLUE 发布的最新一轮华文大模子诚恳性幻觉测评成果,豆包大模子1.5 Pro(Doubao-1.5-pro-32k)以仅4%的幻觉率、96%的准确率名次总榜第一,超越 DeepSeek-R1、DeepSeek-V3、Gemini-2.5-pro、GPT-4o-latest 等中外主流模子。
在涵盖文本纲领、多文本问答、对话补全等关键任务的细分评测中,豆包大模子1.5 Pro也均位列大家第一,在阅读理衔命务中,其准确率则为国内最高,展现出在复杂话语涌现与生成场景中的出色能力。
SuperCLUE 由悠闲第三方推出,是刻下华文谣言语模子评测的遑急基准体系。其中 SuperCLUE-Faith 聚焦华文实质生成进程中的诚恳性与幻觉阻挡能力,从文本纲领、阅读涌现、多文本问答以及对话补全等角度伸开测评,对象包括国表里策画16款具有代表性的模子,评估成果具备较强公信力与行业参考价值。
当今,豆包大模子眷属已隐敝全模态、全场景,包括谣言语模子、深度念念考模子、视觉涌现模子、语音大模子,以及图像、视频等视觉大模子,企业不错通过字节跨越旗下云奇迹平台火山引擎使用豆包大模子API奇迹。其中, 豆包大模子1.5 Pro 基于 MoE 架构构建并遴荐考试-推理一体化想象念念路,在保证高性能的同期显耀镌汰推理资本。通过激活有限参数终端对大限制场景的精确涌现与生成,其空洞性能已高出多款超大稠密预考试模子。
规则2025年3月底,豆包大模子日均 tokens 调用量已高出12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC 请问涌现,2024年中国公有云大模子调用量激增,火山引擎以46.4%的市集份额位居中国市集第一。
据悉,火山引擎将于6月11日在北京举办FORCE原能源大会,将带来豆包大模子的最新升级阐扬与能力进化。