AMD-Llama-135m

1年前发布 60 0 0

AMD-Llama-135m是一个基于LLaMA2模型架构训练的语言模型，能够在AMD MI250 GPU上流畅加载使用。该模型支持生成文本和代码，适用于多种自然语言处理任务。

收录时间：

2025-06-02

打开网站手机查看

代码辅助 # 代码生成 # 文本生成 # 机器学习 # 语言模型

AMD-Llama-135m

AMD-Llama-135m

AMD-Llama-135m是一个基于LLaMA2模型架构训练的语言模型，能够在AMD MI250 GPU上流畅加载使用。该模型支持生成文本和代码，适用于多种自然语言处理任务。

数据统计

相关导航

Integuru

Integuru是一个AI代理，能够通过逆向工程技术生成第三方平台的集成代码。它通过分析浏览器的网络请求和用户的操作，自动生成能够触发特定动作的Python代码。这项技术的重要性在于，它可以帮助开发者无需深入了解第三方平台的内部API，即可快速构建集成解决方案，提高开发效率并降低技术门槛。Integuru由Integuru.ai开发，是一个开源项目，支持自定义请求和额外功能的开发。

Vibe Coder

Vibe Coder 是由 Deepgram 开发的一款开源 VS Code 扩展，旨在探索语音驱动编程的可能性。它利用语音识别技术，让用户通过语音指令与 AI 编程助手进行交互，快速将想法转化为代码原型。这种创新的编程方式被称为‘vibe coding’，旨在提高编程效率并改变未来软件开发的方式。Vibe Coder 目前处于实验阶段，Deepgram 希望通过社区反馈不断完善该工具。

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B 是一个经过强化学习优化的推理模型，基于 Qwen-7B 进行了蒸馏优化。它在数学、代码和推理任务上表现出色，能够生成高质量的推理链和解决方案。该模型通过大规模强化学习和数据蒸馏技术，显著提升了推理能力和效率，适用于需要复杂推理和逻辑分析的场景。

Qwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力，通过扩展训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版本，具有因果语言模型、预训练和后训练、transformers架构等特点。

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

该产品是一个基于Qwen2.5-32B的4位量化语言模型，通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时，显著降低了模型的存储和计算需求，适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景，如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。

AIOnPulse

Gemini 2.5 Pro是一款基于最先进的AI技术的编程插件，能够提高编程效率，帮助用户快速生成高质量的代码。其背景信息包括由Google开发，定位于提升编程体验和加速开发流程。

YuLan-Mini

YuLan-Mini是由中国人民大学AI Box团队开发的一款轻量级语言模型，具有2.4亿参数，尽管仅使用1.08T的预训练数据，但其性能可与使用更多数据训练的行业领先模型相媲美。该模型特别擅长数学和代码领域，为了促进可复现性，团队将开源相关的预训练资源。

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，编码能力与GPT-4o相匹配。此外，Qwen2.5-Coder还为真实世界应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...