Qwen2.5-Coder-0.5B-Instruct-AWQ

5个月前发布 3 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力,通过扩展训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版...

收录时间:
2025-05-29
Qwen2.5-Coder-0.5B-Instruct-AWQQwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成代码推理代码修复。基于Qwen2.5的强大能力,通过扩展训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版本,具有因果语言模型、预训练和后训练、transformers架构等特点。

一丢导航 - 上一丢,不易丢

数据统计

相关导航

Huginn-0125

Huginn-0125

Huginn-0125是一个由马里兰大学帕克分校Tom Goldstein实验室开发的潜变量循环深度模型。该模型拥有35亿参数,经过8000亿个token的训练,在推理和代码生成方面表现出色。其核心特点是通过循环深度结构在测试时动态调整计算量,能够根据任务需求灵活增加或减少计算步骤,从而在保持性能的同时优化资源利用。该模型基于开源的Hugging Face平台发布,支持社区共享和协作,用户可以自由下载、使用和进一步开发。其开源性和灵活的架构使其成为研究和开发中的重要工具,尤其是在资源受限或需要高性能推理的场景中。
Windsurf Wave 3

Windsurf Wave 3

Windsurf Wave 3 是由 Codeium 团队开发的 AI 编辑器的重大更新版本,旨在通过一系列新功能和改进,为开发者提供更高效、更智能的编程体验。该产品支持多种 AI 模型和工具集成,能够显著提升代码生成、编辑和调试的效率。其主要优点包括强大的 AI 驱动功能、高度的可定制性以及对多种编程场景的支持。产品定位为高端开发工具,主要面向专业开发者和企业用户,价格策略可能涉及付费订阅或企业定制。
Windsurf Wave 2

Windsurf Wave 2

Windsurf Wave 2 是 Codeium 团队推出的一款面向开发者的编程辅助工具的第二波更新。它通过 AI 技术为开发者提供智能代码生成、代码优化、问题排查等功能,旨在提高开发效率和代码质量。该产品支持多种编程语言和开发环境,能够与现有的 IDE 集成,无缝融入开发流程。其主要优点包括高效性、智能化和强大的上下文理解能力。Windsurf Wave 2 定位为高端开发工具,适合需要处理复杂代码库的企业和专业开发者使用。目前,该产品提供 SaaS 和混合部署方案,满足不同用户的需求。
NovaSky

NovaSky

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术(如 S*)、强化学习蒸馏推理等技术,显著提升了非推理模型的性能,使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案,帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky Computing Lab @ Berkeley,具有强大的学术支持和前沿的技术研究基础。目前,NovaSky 提供多种模型优化方法,包括但不限于推理成本优化和模型蒸馏技术,满足不同开发者的需求。
Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等,成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配,还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型,具有因果语言模型、预训练和后训练、transformers架构等特点。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...