音频与语音 API 价格

79 个模型 — TTS、ASR 和实时语音

本页收录 79 个音频/语音 AI 模型,当前最低价格 ¥0.0181/分钟,来自 Universal-2。其中 43 个来源价格自动抓取,36 个为手动维护。涵盖 TTS、ASR 和 Realtime 三大类别,点击「详情 →」查看各提供商完整对比。

模型最低价详情
Universal-2
¥0.0181/分钟
详情 →
Universal Streaming
¥0.0181/分钟
详情 →
Universal-3 Pro
¥0.0254/分钟
详情 →
Nova-2
¥0.0312/分钟
详情 →
Nova-3
¥0.0312/分钟
详情 →
Whisper Large
¥0.0348/分钟
详情 →
Gemini 2.5 Flash TTS
¥0.0362/$/1K chars
详情 →
Whisper 1
¥0.0435/$/minute
详情 →
suno_uploads
¥0.0495/次
详情 →
Universal-3 Pro Streaming
¥0.0544/分钟
详情 →
Speech 2.8 Turbo
¥0.0580/$/1K chars
详情 →
Kling Audio
¥0.0725/$/second
详情 →
audio1.0
¥0.0792/次
详情 →
speech-02-hd
¥0.0792/次
详情 →
speech-02-turbo
¥0.0792/次
详情 →
speech-2.6-hd
¥0.0792/次
详情 →
speech-2.6-turbo
¥0.0792/次
详情 →
speech-2.8-hd
¥0.0792/次
详情 →
speech-2.8-turbo
¥0.0792/次
详情 →
MiniMax Speech 02 HD
¥0.0870/$/1K chars
详情 →
Base
¥0.0906/分钟
详情 →
Speech 2.8 HD
¥0.1015/$/1K chars
详情 →
Enhanced
¥0.1051/分钟
详情 →
Nova-2 Medical
¥0.1073/分钟
详情 →
Aura-2
¥0.1087/千字符
详情 →
Aura Asteria
¥0.1087/千字符
详情 →
Aura Luna
¥0.1087/千字符
详情 →
Aura Stella
¥0.1087/千字符
详情 →
TTS-1
¥0.1087/$/1K chars
详情 →
suno_concat_open
¥0.1320/次
详情 →
suno_lyrics_open
¥0.1320/次
详情 →
suno_music_open
¥0.1320/次
详情 →
suno_persona_open
¥0.1320/次
详情 →
suno_upload_open
¥0.1320/次
详情 →
suno_upsample_open
¥0.1320/次
详情 →
suno_upsample-tags
¥0.1320/次
详情 →
Sonic Turbo
¥0.2175/千字符
详情 →
TTS-1 HD
¥0.2175/$/1K chars
详情 →
Kling Advanced Lip Sync
¥0.3625/$/second
详情 →
Suno Music
¥0.3625/$/song
详情 →
Sonic 2
¥0.4713/千字符
详情 →
Sonic 2 Preview
¥0.4713/千字符
详情 →
Sonic English
¥0.4713/千字符
详情 →
Sonic Multilingual
¥0.4713/千字符
详情 →
Eleven Flash v2.5
¥0.5800/千字符
详情 →
GPT-4o Audio
¥0.7250/$/minute
详情 →
Eleven Turbo v2.5
¥1.0875/千字符
详情 →
gpt-4o-mini-tts
¥1.4850/次
详情 →
Eleven English v2
¥2.1750/千字符
详情 →
Eleven Monolingual v1
¥2.1750/千字符
详情 →
Eleven Multilingual v1
¥2.1750/千字符
详情 →
Eleven Multilingual v2
¥2.1750/千字符
详情 →
gemini-2.5-flash-preview-tts
详情 →
gemini-2.5-pro-preview-tts
详情 →
gemini-3.1-flash-tts-preview
详情 →
Google Veo 3.0 + Audio
详情 →
Google Veo 3.0 Fast + Audio
详情 →
gpt-4o-audio-preview
详情 →
gpt-4o-audio-preview-2024-12-17
详情 →
gpt-4o-audio-preview-2025-06-03
详情 →
gpt-4o-mini-audio-preview
详情 →
gpt-4o-mini-audio-preview-2024-12-17
详情 →
gpt-4o-mini-tts-1
详情 →
gpt-4o-mini-tts-2025-03-20
详情 →
gpt-audio
详情 →
gpt-audio-2025-08-28
详情 →
Kokoro-82M TTS
详情 →
GPT Audio
详情 →
GPT Audio Mini
详情 →
qwen3-tts-flash
详情 →
qwen3-tts-flash-2025-11-27
详情 →
tts-1
详情 →
tts-1-1106
详情 →
tts-1-hd
详情 →
tts-1-hd-1106
详情 →
tts-hd-1
详情 →
whisper-1
详情 →
Whisper Large v3
详情 →
Whisper Large v3 (Streaming)
详情 →

热门模型

Universal-2Universal StreamingUniversal-3 ProNova-2Nova-3Whisper Large

常见问题

音频 AI API 有哪些类型?

主要分三类:TTS(文字转语音)、ASR(语音识别)和 Realtime 实时语音 API。本页收录 79 个模型,价格来自官方定价页手动维护。

音频 API 如何计费?

TTS 通常按每千或每百万字符计费;ASR 按处理音频的分钟数计费;Realtime 按会话分钟数计费。点击各模型「详情 →」可查看所有提供商的精确费率。

哪个 TTS 或 ASR API 性价比最高?

当前最低价格来自 Universal-2,起价 ¥0.0181/分钟。取决于使用量和音质要求,点击「详情 →」查看各提供商完整报价。

其他 API 类目

🎬 视频生成🖼️ 图像生成🤖 大语言模型
← 返回 AI API 价格