科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

2025-03-03 18:32:53 作者:精选手游网

本站 3 月 3 日消息,科大讯飞今日宣布星火 X1 升级,并发布星火一体机等系列新品。

其中,深度推理大模型星火 X1 再升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1。

科大讯飞表示,此次升级在数学答题效果上全面提升,尤其是应对竞赛级难题表现显著。同时,星火 X1 在中小学数学作业的批改、辅导以及题目推荐等任务上也展现出了明显的优势。

测试集合来源:中文测试集来自 2023/2024 年各学段考试真题 / 模拟题 / 竞赛题,英文测试集来自 AIME 2024/2025 和 MATH 500 竞赛集

在升级后的星火 X1 加持下,讯飞晓医、星火教师助手、AI 法官助理等应用与产品也实现升级,本站附官方介绍如下:

讯飞晓医首发星火医疗大模型 X1

本次升级,讯飞医疗首发星火医疗大模型 X1,号称“大幅降低了医疗幻觉问题”,在回答复杂问题时,能够逐步解释循证过程,提高了医疗复杂场景推理的逻辑正确性、专业性、可解释性。在诊断推荐、健康咨询、检查检验报告解读等推理任务上效果均已大幅超过了 GPT-4o 以及 DeepSeek R1。

数据来源:晓医、智医助理、安贞心内科等测试集

目前星火医疗大模型 X1 正式应用于 AI 健康助手“讯飞晓医”,与个人健康档案的融合更加深入,在用户健康咨询时,它能深度洞察用户健康状况并思考潜在需求,解决了过往 AI 医疗咨询中“建议答案宽泛不实用”的痛点,给出的医疗建议更加个性化、更具体实用。

例如,用户在咨询疾病用药时,晓医能够循证指出该疾病正确的用药原则,同时结合个人既往健康状况,给出更适合更详实的处理意见和注意事项。

星火教师助手

基于讯飞星火 X1 的全面升级,面向备授课的星火教师助手也进一步升级,给出了更清晰、更详实的 AI 教学思路。

小编推荐

排行榜