NovaSky

1年前发布 44 0 0

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术（如 S*）、强化学习蒸馏推理等技术，显著提升了非推理模型的性能，使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案，帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky ...

收录时间：

2025-05-29

打开网站手机查看

代码辅助 # 人工智能 # 代码生成 # 强化学习 # 推理优化 # 模型蒸馏 # 编程工具

NovaSky

NovaSky

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术（如 S*）、强化学习蒸馏推理等技术，显著提升了非推理模型的性能，使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案，帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky Computing Lab @ Berkeley，具有强大的学术支持和前沿的技术研究基础。目前，NovaSky 提供多种模型优化方法，包括但不限于推理成本优化和模型蒸馏技术，满足不同开发者的需求。

数据统计

相关导航

openai-agents-python

OpenAI Agents SDK是一个用于构建多智能体工作流的框架。它允许开发者通过配置指令、工具、安全机制和智能体之间的交接来创建复杂的自动化流程。该框架支持与任何符合OpenAI Chat Completions API格式的模型集成，具有高度的灵活性和可扩展性。它主要用于编程场景中，帮助开发者快速构建和优化智能体驱动的应用程序。

Sonus-1

Sonus-1是Sonus AI推出的一系列大型语言模型（LLMs），旨在推动人工智能的边界。这些模型以其高性能和多应用场景的多功能性而设计，包括Sonus-1 Mini、Sonus-1 Air、Sonus-1 Pro和Sonus-1 Pro (w/ Reasoning)等不同版本，以满足不同需求。Sonus-1 Pro (w/ Reasoning)在多个基准测试中表现突出，特别是在推理和数学问题上，展现了其超越其他专有模型的能力。Sonus AI致力于开发高性能、可负担、可靠且注重隐私的大型语言模型。

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等，成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配，还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型，具有因果语言模型、预训练和后训练、transformers架构等特点。

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型，专门针对代码生成、代码推理和代码修复进行了优化。该模型基于Qwen2.5，训练数据包括源代码、文本代码关联、合成数据等，达到5.5万亿个训练令牌。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型还为现实世界中的应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Runcell

Runcell是一个AI代理，可理解您的笔记本，编写代码并执行单元格，让您专注于洞察。它能够提高数据科学工作流程的效率，节省用户时间和精力。

Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型，基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色，是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用，允许修改和衍生作品，适合学术研究和企业应用。

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中包含了5.5万亿的源代码、文本代码关联、合成数据等，是目前开源代码语言模型中的佼佼者，其编码能力可与GPT-4相媲美。此外，Qwen2.5-Coder还具备更全面的现实世界应用基础，如代码代理等，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...