多语言

排序

发布更新浏览点赞

AstroChart.ai

AstroChart.ai是一个提供个性化星座和出生图读数的人工智能平台。通过整合西方占星术、印度占星术、中国占星术和人体设计等多种传统，帮助用户深入了解自己的宇宙之旅。

0310

AI web page translator by pagesection.com

AI网页翻译器是一款基于人工智能技术的在线工具，能够帮助用户快速翻译网页内容并保持原始格式。该工具具有高效、准确的翻译功能，可大大提高多语言翻译效率。

0400

智能翻译 # AI # HTML # 多语言

AI web page translator by pagesection.com

0570

智能翻译 # AI # HTML # 多语言

AI Text Summarizer

AI 文本摘要工具利用人工智能技术快速提取文本关键信息，节省阅读时间。其主要优点包括准确性高、速度快、支持多语言。背景信息包括公司成立时间、团队背景及技术优势。定位于提高工作效率和学习效率的生产力工具。

0430

智能聊天机器人 # 准确 # 多内容适用 # 多语言

ClipyBoard

ClipyBoard是一个帮助管理客服信息的工具。它允许用户配置信息并邀请协作者，让他们完全掌控客服发送的信息。

0270

AI商业与管理 # 信息管理 # 协作 # 多语言

Llama-3.2-1B

Llama-3.2-1B是由Meta公司发布的多语言大型语言模型，专注于文本生成任务。该模型使用优化的Transformer架构，并通过监督式微调（SFT）和人类反馈的强化学习（RLHF）进行调优，以符合人类对有用性和安全性的偏好。该模型支持8种语言，包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，并在多种对话使用案例中表现优异。

0300

智能聊天机器人 # Transformer # 多语言 # 对话系统

Nexty

Nexty 是一个功能齐全的 Next.js SaaS 全栈模板，让你能够快速构建各种商业网站，无论是内容站、工具站还是集成 AI 能力的付费网站。该模板提供完整的用户认证、支付、内容管理和 AI 功能，模块化设计帮助开发者专注于产品创新。

0440

搜索引擎优化 # AI # CMS # SaaS

Phind.com

Phind是一款基于人工智能的先进搜索工具，能够通过多轮对话和多语言支持帮助用户快速获取信息。它支持多种搜索方式，包括文本、语音和图像搜索，能够提供更精准的搜索结果。Phind的主要优点是其强大的自然语言处理能力和多语言支持，能够满足不同用户的需求。该产品定位为高端智能搜索工具，适合需要高效获取信息的用户。

0360

智能聊天机器人 # 人工智能 # 多语言 # 搜索

Readsss

Readsss是一个提供每日音频新闻简报的应用程序，用户可以订阅并收听来自他们喜爱的Twitter人物的更新。它利用音频形式让用户在忙碌的日程中保持信息更新，同时提供个性化的音频内容。产品的主要优点包括便捷性、个性化和多语言支持。Readsss目前提供免费和付费订阅选项，针对不同的用户需求提供不同的服务。

0260

音频处理 # 个性化订阅 # 信息更新 # 多语言

FireRedASR-AED-L

FireRedASR-AED-L 是一个开源的工业级自动语音识别模型，专为满足高效率和高性能的语音识别需求而设计。该模型采用基于注意力的编码器-解码器架构，支持普通话、中文方言和英语等多种语言。它在公共普通话语音识别基准测试中达到了新的最高水平，并且在歌唱歌词识别方面表现出色。该模型的主要优点包括高性能、低延迟和广泛的适用性，适用于各种语音交互场景。其开源特性使得开发者可以自由地使用和修改代码，进一步推动语音识别技术的发展。

0350

语音处理 # 多语言 # 工业级 # 开源

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct 是微软开发的多模态基础模型，支持文本、图像和音频输入，生成文本输出。该模型基于Phi-3.5和Phi-4.0的研究和数据集构建，经过监督微调、直接偏好优化和人类反馈强化学习等过程，以提高指令遵循能力和安全性。它支持多种语言的文本、图像和音频输入，具有128K的上下文长度，适用于多种多模态任务，如语音识别、语音翻译、视觉问答等。该模型在多模态能力上取得了显著提升，尤其在语音和视觉任务上表现出色。它为开发者提供了强大的多模态处理能力，可用于构建各种多模态应用。

0430

智能聊天机器人 # AI模型 # 多模态 # 多语言

Versatile-OCR-Program

该产品是一个专门设计的 OCR 系统，旨在从复杂的教育材料中提取结构化数据，支持多语言文本、数学公式、表格和图表，能够生成适用于机器学习训练的高质量数据集。该系统利用多种技术和 API，能够提供高精度的提取结果，适合学术研究和教育工作者使用。

0340

数据分析 # OCR # 图表识别 # 多语言

Sana_1600M_512px_MultiLing

Sana是一个由NVIDIA开发的文本到图像的框架，能够高效生成高达4096×4096分辨率的图像。Sana能够以极快的速度合成高分辨率、高质量的图像，并且具有强烈的文本-图像对齐能力，可以在笔记本电脑GPU上部署。该模型基于线性扩散变换器，使用固定预训练的文本编码器和空间压缩的潜在特征编码器，支持英文、中文和表情符号混合提示。Sana的主要优点包括高效率、高分辨率图像生成能力以及多语言支持。

0370

文案写作 # Nvidia # 多语言 # 文本到图像

InternLM3

InternLM3 是由 InternLM 团队开发的一系列高性能语言模型，专注于文本生成任务。该模型通过多种量化技术优化，能够在不同硬件环境下高效运行，同时保持出色的生成质量。其主要优点包括高效的推理性能、多样化的应用场景以及对多种文本生成任务的优化支持。InternLM3 适用于需要高质量文本生成的开发者和研究人员，能够帮助他们在自然语言处理领域快速实现应用。

0390

文案写作 # 多语言 # 搞笑 # 文本生成

Office Translator

OFFICE TRANSLATOR使用最新的人工智能技术进行文档翻译，支持多种格式：PDF、DOCX、XLSX、PPT、EPUB等，满足法律、游戏、金融等不同场景下的翻译需求。

0310

智能翻译 # 人工智能 # 多语言 # 文档翻译

Sana_1600M_1024px_MultiLing

Sana是一个由NVIDIA开发的文本到图像的框架，能够高效生成高达4096×4096分辨率的图像。该模型以惊人的速度合成高分辨率、高质量的图像，并保持强大的文本-图像对齐能力，可部署在笔记本电脑GPU上。Sana模型基于线性扩散变换器，使用预训练的文本编码器和空间压缩的潜在特征编码器，支持Emoji、中文和英文以及混合提示。

0380

文案写作 # Nvidia # 图像合成 # 多语言

shoonya

shoonya是一个专注于现代商业领域的基础模型与代理，提供多语言支持、本地化服务和针对特定商业垂直领域的优化。它通过为电子商务用例特别调整的基础模型，支持多种语言和本地上下文，以推动下一代零售业务的发展。shoonya的技术背景是基于人工智能和机器学习，旨在理解和优化区域商业模式、术语和偏好，为用户提供更加个性化和高效的购物体验。

0370

电子商务 # 人工智能 # 多语言 # 本地化

微软Bing翻译

Microsoft翻译工具是一款强大的在线翻译工具，支持文字翻译和语音翻译，准确快速，适用于旅行和商务沟通。

0930

AI翻译 AI语言翻译 # 多语言 # 翻译工具 # 跨语言交流

Silvia

Silvia是一款能够适应用户说话方式的语音输入系统，支持用户在不同语言之间自由切换，即使在句子中也能无缝切换。它支持英语和西班牙语，并且即将支持法语、罗马尼亚语、德语和荷兰语。Silvia作为苹果应用商店中的扩展，可以用于所有聊天平台，如iMessage、WhatsApp、Signal、Telegram、Messenger等，让用户在任何需要打字的地方都能使用语音输入。

0330

智能聊天机器人 # 多语言 # 聊天扩展 # 语音输入

tulu-3-sft-olmo-2-mixture

allenai/tulu-3-sft-olmo-2-mixture是一个大规模的多语言数据集，包含了用于训练和微调语言模型的多样化文本样本。该数据集的重要性在于它为研究人员和开发者提供了丰富的语言资源，以改进和优化多语言AI模型的性能。产品背景信息包括其由多个来源的数据混合而成，适用于教育和研究领域，且遵循特定的许可协议。

0340

文案写作 # 多语言 # 教育 # 文本数据集

ElevenLabs Scribe

Scribe 是由 ElevenLabs 开发的高精度语音转文字模型，旨在处理真实世界音频的不可预测性。它支持99种语言，提供单词级时间戳、说话人分离和音频事件标记等功能。Scribe 在 FLEURS 和 Common Voice 基准测试中表现卓越，超越了 Gemini 2.0 Flash、Whisper Large V3 和 Deepgram Nova-3 等领先模型。它显著降低了传统服务不足语言（如塞尔维亚语、粤语和马拉雅拉姆语）的错误率，这些语言在竞争模型中的错误率通常超过40%。Scribe 提供 API 接口供开发者集成，并将推出低延迟版本以支持实时应用。

0340

语音处理 # API # 多语言 # 实时应用

Humy.ai

Humy.ai是一个产品，允许小团队创建定制的AI助手。通过无代码构建，您可以在10分钟内创建和发布自己的AI助手，为客户提供价值、节省资金和建立互动。我们的AI助手可以记住上下文、提供建议并主动解决问题，与用户进行更深入的连接，推动转化。无需编码，即可自定义AI助手的行为。支持多种语言，可适应全球范围内的客户。

0450

低代码/无代码 # AI助手 # 多语言 # 定制化

CosyVoice 2

CosyVoice 2是由阿里巴巴集团的SpeechLab@Tongyi团队开发的语音合成模型，它基于监督离散语音标记，并结合了两种流行的生成模型：语言模型（LMs）和流匹配，实现了高自然度、内容一致性和说话人相似性的语音合成。该模型在多模态大型语言模型（LLMs）中具有重要的应用，特别是在交互体验中，响应延迟和实时因素对语音合成至关重要。CosyVoice 2通过有限标量量化提高语音标记的码本利用率，简化了文本到语音的语言模型架构，并设计了块感知的因果流匹配模型以适应不同的合成场景。它在大规模多语言数据集上训练，实现了与人类相当的合成质量，并具有极低的响应延迟和实时性。

0300

社交媒体 # 低延迟 # 多语言 # 大型语言模型

Whisper Turbo.online

Whisper Turbo 是基于 Whisper Large-v3 模型优化的语音识别工具，专为快速语音转录而设计。它利用先进的 AI 技术，能够高效地将不同音频源的语音转换为文本，支持多种语言和口音。该工具免费提供给用户，旨在帮助人们节省时间和精力，提高工作效率。其主要面向需要快速准确转录语音内容的用户，如博主、内容创作者、企业等，为他们提供便捷的语音转文字解决方案。

0400

语音处理 # AI # 免费 # 多语言

TalkAI练口语

TalkAI练口语是一款先进的口语学习工具，通过AI技术为用户提供一对一的口语陪聊服务，支持超过60种语言。其重要性在于帮助用户突破语言障碍，提升口语水平，无论是初学者还是希望提升口语能力的学习者都能从中受益。该产品由深圳市惊叹科技有限公司开发，于2021年12月03日成立，注册地位于深圳市宝安区。其服务对象广泛，包括学校、企业和个人用户，致力于通过技术创新推动语言学习的普及和发展。目前暂无明确公开的价格信息，但根据其功能和服务范围，推测其可能采用付费模式或提供部分免费试用服务。

0420

智能翻译 # AI # 口语学习 # 多语言

SigLIP2

SigLIP2 是谷歌开发的多语言视觉语言编码器，具有改进的语义理解、定位和密集特征。它支持零样本图像分类，能够通过文本描述直接对图像进行分类，无需额外训练。该模型在多语言场景下表现出色，适用于多种视觉语言任务。其主要优点包括高效的语言图像对齐能力、支持多种分辨率和动态分辨率调整，以及强大的跨语言泛化能力。SigLIP2 的推出为多语言视觉任务提供了新的解决方案，尤其适合需要快速部署和多语言支持的场景。

0400

图像生成 # 图像分类 # 多语言 # 视觉语言模型

Lionbridge AI

Lionbridge Laⁱnguage Cloud是一款AI驱动的多模态内容平台，帮助企业将产品和服务本地化到全球市场，提供高质量的翻译和本地化服务，支持多语言的数字营销和用户界面翻译，满足全球用户的需求。

0230

SQL助手编程AI # 多语言 # 本地化

YuE-s1-7B-anneal-en-cot

YuE是一个开创性的开源基础模型系列，专为音乐生成设计，能够将歌词转化为完整的歌曲。它能够生成包含吸引人的主唱和配套伴奏的完整歌曲，支持多种音乐风格。该模型基于深度学习技术，具有强大的生成能力和灵活性，能够为音乐创作者提供强大的工具支持。其开源特性也使得研究人员和开发者可以在此基础上进行进一步的研究和开发。

0430

音乐创作 # 多语言 # 多风格 # 开源

Plus AI PowerPoint

Plus AI PowerPoint Maker是一款利用人工智能技术辅助用户创建和编辑PowerPoint演示文稿的工具。它通过文本到演示文稿、文档到演示文稿等功能，帮助用户节省时间，提高工作效率。产品背景信息显示，Plus AI旨在为需要制作工作或学校演示文稿的专业人士提供帮助，其主要优点包括多语言支持、与PowerPoint的无缝集成、以及提供美观的模板。价格方面，Plus AI提供免费试用，并有企业定制服务。

0280

办公助手 # AI # PowerPoint # 企业定制

QuickPiperAudiobook

QuickPiperAudiobook是一款能够将PDF、epub、txt、mobi、djvu、HTML、docx等多种文本格式转换为有声读物的桌面客户端软件。它使用piper模型支持多种语言，所有转换过程完全离线进行，保护用户隐私。该软件特别适合需要将文本内容快速转换为音频格式的用户，例如视障人士、喜欢听书的用户或需要学习外语的用户。

0910

生产力 # 多语言 # 文本转换 # 有声读物

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型，基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色，是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用，允许修改和衍生作品，适合学术研究和企业应用。

0400

代码辅助 # 代码生成 # 多语言 # 开源

RapidSubs

RapidSubs是一个利用人工智能技术，为视频内容快速生成时尚字幕的应用。它支持99种语言的语音识别和转录，用户可以根据个人喜好编辑字幕的位置、颜色和样式。无论是内容创作者、教育工作者还是市场营销人员，RapidSubs都能帮助他们轻松地增强视频内容并与观众建立联系。该应用提供免费下载，无需注册账户即可立即开始添加字幕。

0490

视频创作 # AI转录 # 内容创作 # 多语言

Grok App

Grok是一个由X.AI Corp开发的AI助手应用，旨在提供最真实、有用和好奇的答案。用户可以通过Grok获取任何问题的答案、生成引人注目的图像，并上传图片以更深入地了解世界。Grok以其高质量的图像生成、实时更新的数据、对话式的幽默语气和注重隐私的特性，为用户提供了一个安全、高效的AI体验平台。

02880

图像生成 # AI助手 # 信息查询 # 图像生成

Beyond Presence

Beyond Presence 是一家专注于利用数字孪生技术打造类人对话体验的公司。其核心产品是交互式虚拟形象（Conversational Avatars），能够实现高度逼真的实时对话。这种技术通过模拟人类的外貌、语音和行为，为企业提供了一种全新的客户服务、销售和培训解决方案。它不仅能够降低人力成本，还能实现 24/7 的不间断服务，提升客户满意度和忠诚度。此外，该产品支持多种语言，能够满足全球不同地区用户的需求。Beyond Presence 的产品定位是为企业提供高效、个性化且具有创新性的数字交互工具，其价格策略灵活，包括免费试用、个人、专业、商业和企业等多种套餐，以满足不同规模和需求的客户。

0400

客户服务 # 人工智能 # 培训 # 多语言

Llasa

Llasa是一个基于Llama框架的文本到语音（TTS）基础模型，专为大规模语音合成任务设计。该模型利用16万小时的标记化语音数据进行训练，具备高效的语言生成能力和多语言支持。其主要优点包括强大的语音合成能力、低推理成本和灵活的框架兼容性。该模型适用于教育、娱乐和商业场景，能够为用户提供高质量的语音合成解决方案。目前该模型在Hugging Face上免费提供，旨在推动语音合成技术的发展和应用。

0300

语音处理 # 人工智能 # 多语言 # 技术研究

Hugo Translator

hugo-translator是一个基于大型语言模型（LLM）驱动的文章翻译工具。它能够自动将文章从一种语言翻译为另一种语言，并生成新的Markdown文件。该工具支持OpenAI和DeepSeek的模型，用户可以通过简单的配置和命令快速完成翻译任务。它主要面向使用Hugo静态网站生成器的用户，帮助他们快速实现多语言内容的生成和管理。产品目前免费开源，旨在提高内容创作者的效率，降低多语言内容发布的门槛。

0460

智能翻译 # HUGO # LLM # markdown

Slider AI

Slider AI是一款基于人工智能的演示文稿生成工具，能够通过简单的提示快速生成精美的演示文稿，支持多种语言。用户可以利用该平台将想法快速转化为精美的演示文稿，同时还能够使用AI生成的图片来提升视觉效果。产品设计旨在帮助用户节省时间，提高工作效率。

0470

办公助手 # 人工智能 # 多语言 # 演示文稿

Content Studio

Content Studio是一个利用人工智能技术帮助用户轻松生成高质量视频的平台，适用于社交媒体、市场营销等。它通过简化视频制作流程，让用户在短短几分钟内就能创作出专业水准的视频内容，无需视频编辑经验，节省时间，提高效率。

0570

视频生成 # AI视频制作 # 多语言 # 市场营销

TransVIP

TransVIP是由微软研究院开发的一个创新的语音到语音翻译系统，它能够在翻译过程中保留说话者的声音特征和等时性（即说话的节奏和停顿），这对于视频配音等场景非常有用。TransVIP通过联合概率实现端到端的推理，同时利用不同的数据集进行级联处理。该技术的主要优点包括高适应性、声音特征保留以及等时性保持，这使得它在多语言交流和内容本地化领域具有重要价值。

0330

智能翻译 # 声音保留 # 多语言 # 等时性

GlobalSeo

GlobalSeo是一个利用AI技术实现网站翻译和SEO优化服务的平台。它通过简单的集成步骤，帮助用户将网站内容翻译成93种语言，从而实现全球市场的覆盖。产品的主要优点包括即时AI翻译、自动SEO优化、低成本高效率，尤其适合需要快速国际化和提升在线可见度的企业。

0550

搜索引擎优化 # AI翻译 # SEO优化 # 国际化

Aya Expanse 32B

Aya Expanse 32B是由Cohere For AI开发的多语言大型语言模型，拥有32亿参数，专注于提供高性能的多语言支持。它结合了先进的数据仲裁、多语言偏好训练、安全调整和模型合并技术，以支持23种语言，包括阿拉伯语、中文（简体和繁体）、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。该模型的发布旨在使社区基础的研究工作更加易于获取，通过发布高性能的多语言模型权重，供全球研究人员使用。

0320

文案写作 # Transformers # 人工智能 # 多语言

Aya Vision 32B

Aya Vision 32B 是由 Cohere For AI 开发的先进视觉语言模型，拥有 320 亿参数，支持 23 种语言，包括英语、中文、阿拉伯语等。该模型结合了最新的多语言语言模型 Aya Expanse 32B 和 SigLIP2 视觉编码器，通过多模态适配器实现视觉与语言理解的结合。它在视觉语言领域表现出色，能够处理复杂的图像与文本任务，如 OCR、图像描述、视觉推理等。该模型的发布旨在推动多模态研究的普及，其开源权重为全球研究人员提供了强大的工具。该模型遵循 CC-BY-NC 许可证，并需遵守 Cohere For AI 的合理使用政策。

0420

图像生成 # OCR # 图像描述 # 多语言

D-ID AI Video Translate

D-ID的AI Video Translate是一款利用人工智能技术，将视频内容自动翻译成多种语言的产品。它通过声音克隆和唇部动作适配技术，确保翻译后的视频在语言和视觉上都能保持自然和真实性。这项技术对于希望扩大全球观众范围的市场营销团队、销售团队、教育工作者和内容创作者来说非常重要。它不仅降低了传统视频制作的麻烦和成本，还通过本地化视频内容，帮助企业扩大影响力。

0380

智能翻译 # 人工智能 # 内容本地化 # 多语言

InternVL2_5-4B

InternVL2_5-4B是一个先进的多模态大型语言模型（MLLM），在InternVL 2.0的基础上进行了核心模型架构的维护，并在训练和测试策略以及数据质量上进行了显著增强。该模型在处理图像、文本到文本的任务中表现出色，特别是在多模态推理、数学问题解决、OCR、图表和文档理解等方面。作为开源模型，它为研究人员和开发者提供了强大的工具，以探索和构建基于视觉和语言的智能应用。

0350

文案写作 # Safetensors # TensorBoard # Transformers

aya-101

Aya模型是一个大规模的多语言生成性语言模型，能够在101种语言中遵循指令。该模型在多种自动和人类评估中优于mT0和BLOOMZ，尽管它覆盖的语言数量是后者的两倍。Aya模型使用包括xP3x、Aya数据集、Aya集合、DataProvenance集合的一个子集和ShareGPT-Command等多个数据集进行训练，并在Apache-2.0许可下发布，以推动多语言技术的发展。

0350

文案写作 # 多语言 # 文本生成 # 机器学习

iMemo

iMemo是一个音频记录和转录应用，它通过AI技术帮助用户捕捉和管理信息，支持超过100种语言的即时转录和总结，让用户无论何时何地都能轻松记录讲座、会议、访谈和个人笔记。产品的主要优点包括AI驱动的转录和总结、多语言支持、组织和搜索功能，以及用户友好的界面。iMemo适合学生、教师、商务专业人士、记者、播客等需要高效记录和信息管理的用户。

0310

智能翻译 # AI # 信息管理 # 多语言

Gemini Embedding 文本嵌入模型

Gemini Embedding 是 Google 推出的一种实验性文本嵌入模型，通过 Gemini API 提供服务。该模型在多语言文本嵌入基准测试（MTEB）中表现卓越，超越了之前的顶尖模型。它能够将文本转换为高维数值向量，捕捉语义和上下文信息，广泛应用于检索、分类、相似性检测等场景。Gemini Embedding 支持超过 100 种语言，具备 8K 输入标记长度和 3K 输出维度，同时引入了嵌套表示学习（MRL）技术，可灵活调整维度以满足存储需求。该模型目前处于实验阶段，未来将推出稳定版本。

0400

文案写作 # AI # 多语言 # 文本嵌入

jina-clip-v2

jina-clip-v2是由Jina AI开发的多语言多模态嵌入模型，支持89种语言的图像检索，能够处理512x512分辨率的图像，提供从64到1024不同维度的输出，以适应不同的存储和处理需求。该模型结合了强大的文本编码器Jina-XLM-RoBERTa和视觉编码器EVA02-L14，通过联合训练创建了对齐的图像和文本表示。jina-clip-v2在多模态搜索和检索方面提供了更准确、更易用的能力，特别是在打破语言障碍、提供跨模态理解和检索方面表现出色。

0380

文案写作 # 图像检索 # 多模态 # 多语言

InternVL2_5-8B

InternVL2_5-8B是由OpenGVLab开发的一款多模态大型语言模型（MLLM），它在InternVL 2.0的基础上进行了显著的训练和测试策略增强，以及数据质量提升。该模型采用'ViT-MLP-LLM'架构，集成了新增量预训练的InternViT与多种预训练语言模型，如InternLM 2.5和Qwen 2.5，使用随机初始化的MLP projector。InternVL 2.5系列模型在多模态任务上展现出卓越的性能，包括图像和视频理解、多语言理解等。

0270

文案写作 # Safetensors # TensorBoard # Transformers

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

该产品是一个基于Qwen2.5-32B的4位量化语言模型，通过GPTQ技术实现高效推理和低资源消耗。它在保持较高性能的同时，显著降低了模型的存储和计算需求，适合在资源受限的环境中使用。该模型主要面向需要高性能语言生成的应用场景，如智能客服、编程辅助、内容创作等。其开源许可和灵活的部署方式使其在商业和研究领域具有广泛的应用前景。

0300

代码辅助 # 内容创作 # 多语言 # 开源

Llama-3.3-70B-Instruct

Llama-3.3-70B-Instruct是由Meta开发的一个70亿参数的大型语言模型，专门针对多语言对话场景进行了优化。该模型使用优化的Transformer架构，并通过监督式微调(SFT)和基于人类反馈的强化学习(RLHF)来提高其有用性和安全性。它支持多种语言，并能够处理文本生成任务，是自然语言处理领域的一项重要技术。

0370

文案写作 # Transformer # 多语言 # 大型语言模型

音刻

音刻转录是一款专注于音视频转录的在线工具，通过先进的语音识别技术，能够快速将音频或视频文件转换为文本。其主要优点包括转录速度快、准确率高、支持多种语言和文件格式。产品定位为高效办公和学习辅助工具，旨在帮助用户节省时间和精力，提升工作效率。音刻转录提供免费试用版本，用户可以体验其核心功能，付费版本则提供更多高级功能和大文件支持，满足不同用户的需求。

0470

语音处理 # 办公辅助 # 多语言 # 搞笑

AI谷歌翻译

AI谷歌翻译是一个提供在线翻译服务的网站，支持中文、英文、日语等多种语言的互译。它采用了先进的翻译模型，如Gemini 1.5和GPT 4.0，能够根据用户选择的领域进行专业翻译，确保翻译的准确性和专业性。该产品背景信息显示，它提供免费的翻译服务，对于200字以内的翻译不收费，适合需要快速、准确翻译的用户。

0320

智能翻译 # 专业领域 # 免费 # 在线服务

EXAONE-3.5-32B-Instruct-AWQ

EXAONE-3.5-32B-Instruct-AWQ是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理，在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比，在通用领域保持竞争力。该模型通过AWQ量化技术，实现了4位组级别的权重量化，优化了模型的部署效率。

0420

文案写作 # AWQ量化 # 多语言 # 文本生成

FineWeb2

FineWeb2是由Hugging Face提供的一个大规模多语言预训练数据集，覆盖超过1000种语言。该数据集经过精心设计，用于支持自然语言处理(NLP)模型的预训练和微调，特别是在多种语言上。它以其高质量、大规模和多样性而闻名，能够帮助模型学习跨语言的通用特征，提升在特定语言任务上的表现。FineWeb2在多个语言的预训练数据集中表现出色，甚至在某些情况下，比一些专门为单一语言设计的数据库表现更好。

0240

数据分析 # Hugging Face # NLP # 多语言

OLMo 2 1124 13B Preference Mixture

OLMo 2 1124 13B Preference Mixture是一个由Hugging Face提供的大型多语言数据集，包含377.7k个生成对，用于训练和优化语言模型，特别是在偏好学习和指令遵循方面。该数据集的重要性在于它提供了一个多样化和大规模的数据环境，有助于开发更加精准和个性化的语言处理技术。

0260

数据分析 # 偏好学习 # 多语言 # 指令遵循

Silo

Silo是一个专注于多模型对话的平台，它通过整合不同的对话模型，为用户提供丰富、深入的交流体验。该平台不仅能够处理文本对话，还能生成图像，为用户提供视觉化的交流方式。Silo的背景信息显示，它是一个创新的尝试，旨在通过技术手段打破传统对话的局限，让交流更加生动和有趣。目前，Silo提供免费试用，具体价格和定位尚未明确。

01640

智能聊天机器人 # 个性化体验 # 多模型对话 # 多语言

ElevenLabs GenFM

ElevenReader 是一款利用人工智能技术将PDF、文章、电子书等文本内容转化为播客的应用。它通过AI技术生成智能播客，让用户在任何时间、任何地点都能聆听内容。产品背景信息显示，ElevenLabs致力于通过高质量的AI音频技术，帮助用户以全新的方式消费和体验内容。GenFM on ElevenReader支持多种语言，满足全球用户的需求。

0450

文案写作 # AI音频 # 内容创作 # 多语言

Image/Manga Translator

该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。

0420

智能翻译 # OCR # 图像修补 # 图像翻译

Aya Expanse-8b

Aya Expanse是一个具有高级多语言能力的开放权重研究模型。它专注于将高性能的预训练模型与Cohere For AI一年的研究成果相结合，包括数据套利、多语言偏好训练、安全调整和模型合并。该模型是一个强大的多语言大型语言模型，服务于23种语言，包括阿拉伯语、中文（简体和繁体）、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。

0370

文案写作 # 变换器架构 # 多语言 # 文本生成

CLaMP 3

CLaMP 3 是一种先进的音乐信息检索模型，通过对比学习对齐乐谱、演奏信号、音频录音与多语言文本的特征，支持跨模态和跨语言的音乐检索。它能够处理未对齐的模态和未见的语言，展现出强大的泛化能力。该模型基于大规模数据集 M4-RAG 训练，涵盖全球多种音乐传统，支持多种音乐检索任务，如文本到音乐、图像到音乐等。

0250

音乐创作 # 多模态 # 多语言 # 对比学习

Supertone Play

Supertone Play是一个专注于语音克隆和AI语音内容创作的平台。它利用先进的AI技术，让用户能够通过简单的语音输入，创造出个性化的语音内容。这种技术可以广泛应用于娱乐、教育、商业等多个领域，为用户提供了一种全新的表达和创作方式。平台的语音克隆功能可以让用户在短时间内创建出独特的语音模型，而AI语音内容创作则可以根据用户的需求生成高质量的语音内容。这种技术的主要优点是高效、个性化和创新性，能够满足不同用户在语音创作方面的需求。

0420

语音处理 # AI语音 # 个性化 # 内容创作

Text to Speech & AI Voice Generator

介绍使用 ElevenLabs 的 AI 音频创建逼真的语...

0400

音频 # AI 音频 # 内容创作 # 商业解决方案

没有了

AstroChart.ai

AI web page translator by pagesection.com

AI web page translator by pagesection.com

AI Text Summarizer

ClipyBoard

Llama-3.2-1B

Nexty

Phind.com

Readsss

FireRedASR-AED-L

Phi-4-multimodal-instruct

Versatile-OCR-Program

Sana_1600M_512px_MultiLing

InternLM3

Office Translator

Sana_1600M_1024px_MultiLing

shoonya

微软Bing翻译

Silvia

tulu-3-sft-olmo-2-mixture

ElevenLabs Scribe

Humy.ai

CosyVoice 2

Whisper Turbo.online

TalkAI练口语

SigLIP2

Lionbridge AI

YuE-s1-7B-anneal-en-cot

Plus AI PowerPoint

QuickPiperAudiobook

DeepSeek-R1-Distill-Llama-8B

RapidSubs

Grok App

Beyond Presence

Llasa

Hugo Translator

Slider AI

Content Studio

TransVIP

GlobalSeo

Aya Expanse 32B

Aya Vision 32B

D-ID AI Video Translate

InternVL2_5-4B

aya-101

iMemo

Gemini Embedding 文本嵌入模型

jina-clip-v2

InternVL2_5-8B

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

Llama-3.3-70B-Instruct

音刻

AI谷歌翻译

EXAONE-3.5-32B-Instruct-AWQ

FineWeb2

OLMo 2 1124 13B Preference Mixture

Silo

ElevenLabs GenFM

Image/Manga Translator

Aya Expanse-8b

CLaMP 3

Supertone Play

Text to Speech & AI Voice Generator

热门网址