Light-R1-14B-DS

11个月前发布 24 00

Light-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行强化学习训练,在 AIME24 和 AIME25 数学竞赛基准测试中分别达到了 74.0 和 60.2 的高分,超越了许多 32B 参数量的模型。它在轻量级预算下成功实现了对已经长链推理微调...

收录时间:
2025-05-29
Light-R1-14B-DSLight-R1-14B-DS

Light-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行强化学习训练,在 AIME24 和 AIME25 数学竞赛基准测试中分别达到了 74.0 和 60.2 的高分,超越了许多 32B 参数量的模型。它在轻量级预算下成功实现了对已经长链推理微调模型的强化学习尝试,为开源社区提供了一个强大的数学模型工具。该模型的开源有助于推动自然语言处理教育领域的应用,特别是数学问题解决方面,为研究人员和开发者提供了宝贵的研究基础和实践工具。

数据统计

相关导航

成语游戏大全

成语游戏大全

成语游戏大全是一个集成了多种成语游戏的在线学习平台,旨在通过趣味互动的方式让学习成语变得简单有趣。平台提供了成语闯关、成语接龙、成语消消乐等多种游戏,结合成语词典和成语故事,形成了完整的学习体系。通过游戏化学习,可以提升语言能力、文化素养、思维能力,并培养学习兴趣。产品背景信息显示,成语游戏大全适合各年龄层的用户,特别是在校学生、语言学习者和文化爱好者,有助于提升语文成绩、中文水平和对中华传统文化的理解和欣赏。
BookWatch

BookWatch

BookWatch 是一个专注于为视觉学习者提供动画形式的书籍总结的平台。它通过生动的动画和简洁的总结,帮助用户快速理解书籍的核心思想,节省阅读时间。该平台涵盖多种书籍类别,包括商业、心理学、文学等,适合不同领域的学习者。其技术优势在于将复杂的书籍内容转化为易于理解的视觉形式,提升学习效率。BookWatch 定位为教育工具,旨在通过创新的学习方式,帮助用户更好地吸收知识。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...