YuLan-Mini

12个月前发布 25 00

YuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型,具有2.4亿参数,尽管仅使用1.08T的预训练数据,但其性能可与使用更多数据训练的行业领先模型相媲美。该模型特别擅长数学和代码领域,为了促进可复现性,团队将开源相关的预训练资源。

收录时间:
2025-05-30
YuLan-MiniYuLan-Mini

YuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型,具有2.4亿参数,尽管仅使用1.08T的预训练数据,但其性能可与使用更多数据训练的行业领先模型相媲美。该模型特别擅长数学和代码领域,为了促进可复现性,团队将开源相关的预训练资源。

数据统计

相关导航

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力,适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同,Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力,而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步,将原本较弱的基础模型推向了推理任务的最新技术(SOTA)。
CodebaseToPrompt

CodebaseToPrompt

CodebaseToPrompt 是一个简单工具,能够将本地目录转换为大型语言模型(LLM)的结构化提示。它帮助用户选择需要包含或忽略的文件,然后以可以直接复制到 LLM 中的格式输出,适用于代码审查、分析或文档生成。该工具的主要优点在于其交互性强、操作简便,并且能够在浏览器中直接使用,无需上传任何文件,确保了数据的安全性和隐私性。产品背景信息显示,它是由 path-find-er 团队开发,旨在提高开发者在使用 LLM 进行代码相关任务时的效率。
WebDev Arena

WebDev Arena

WebDev Arena是一个专注于网站开发的AI竞技平台。它通过AI技术为用户提供一个互动式的开发环境,用户可以在平台上挑战构建各种类型的网站。该平台的核心功能是利用AI辅助生成代码和设计布局,帮助开发者快速实现创意。它主要面向有一定编程基础的开发者,尤其是那些希望提升前端开发技能的人群。平台目前处于开放状态,用户可以免费使用其功能,无需支付费用。
Augment Code

Augment Code

Augment Code 是一款面向专业软件工程师的 AI 开发助手,旨在帮助开发者更好地管理和优化复杂的代码库。它通过智能的代码编辑建议、实时代码补全和团队协作功能,提升开发效率并降低维护成本。Augment Code 支持多种开发环境,如 VSCode、JetBrains 和 Vim,并与 GitHub 和 Slack 等工具无缝集成。其主要优点包括高效代码管理、智能编辑建议和强大的团队协作支持,适合大型团队和复杂项目。
OpenAI o3-mini

OpenAI o3-mini

OpenAI o3-mini 是 OpenAI 推出的最新推理模型,专为科学、技术、工程和数学(STEM)领域优化。它在保持低成本和低延迟的同时,提供了强大的推理能力,尤其在数学、科学和编程方面表现出色。该模型支持多种开发者功能,如函数调用、结构化输出等,并且可以根据需求选择不同的推理强度。o3-mini 的推出进一步降低了推理模型的使用成本,使其更适合广泛的应用场景。
DeepSeek Japanese

DeepSeek Japanese

DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型,专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色,采用强化学习和混合专家框架优化性能,以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新,同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛,适合广泛的应用场景。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...