Qwen2.5-Coder-3B-Instruct-GGUF

11个月前发布 30 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础,如代码代理...

收录时间:
2025-05-30
Qwen2.5-Coder-3B-Instruct-GGUFQwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成代码推理代码修复。基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。

数据统计

相关导航

SWE-RL

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。
GLM-Zero-Preview

GLM-Zero-Preview

GLM-Zero-Preview是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强AI推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,在不显著降低通用任务能力的情况下,专家任务能力大幅提升。在AIME 2024、MATH500和LiveCodeBench评测中,效果与OpenAI o1-preview相当。产品背景信息显示,智谱华章科技有限公司致力于通过强化学习技术,提升模型的深度推理能力,未来将推出正式版GLM-Zero,扩展深度思考的能力到更多技术领域。
WaveCoder

WaveCoder

WaveCoder是由微软亚洲研究院开发的代码大语言模型,通过指令微调增强代码大语言模型的广泛性和多功能性。它在代码摘要、生成、翻译、修复等多个编程任务上展现出卓越的性能。WaveCoder的创新之处在于其使用的数据合成框架和两阶段指令数据生成策略,确保了数据的高质量和多样性。该模型的开源,为开发者提供了一个强大的编程辅助工具,有助于提高开发效率和代码质量。
Qwen2.5-Coder Technical Report

Qwen2.5-Coder Technical Report

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型,包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练,并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合,展现出令人印象深刻的代码生成能力,同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能,并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界,而且通过其许可授权,鼓励开发者在现实世界的应用中更广泛地采用。
Qwen2.5-Coder-0.5B-Instruct

Qwen2.5-Coder-0.5B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,通过扩展训练令牌到5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。该模型不仅增强了编码能力,还保持了在数学和通用能力方面的优势,为实际应用如代码代理提供了更全面的基础。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...