操作手册
ElevenLabs 是什么?
ElevenLabs 是全球最先进的 AI 语音合成和声音克隆平台。它能够生成极其逼真的人类语音,支持29种语言,提供数百种高质量预设声音,并允许用户克隆自己的声音。ElevenLabs 的技术被广泛应用于有声书制作、视频配音、游戏角色配音和无障碍语音服务。
功能矩阵
| 功能 | 说明 | 免费版 | 付费版 |
|---|---|---|---|
| 文字转语音 (TTS) | 文本生成自然语音 | 10分钟/月 | 30-500分钟/月 |
| 语音克隆 (Instant) | 上传1分钟音频克隆声音 | 不支持 | 支持 |
| 语音克隆 (Professional) | 上传30分钟音频高精度克隆 | 不支持 | 付费使用 |
| Voice Design | 用文字描述生成全新声音 | 支持 | 支持 |
| 语音转语音 | 改变已有音频的音色 | 不支持 | 支持 |
| Audio Native | 网站嵌入AI朗读组件 | 支持 | 支持 |
| Projects | 长篇内容配音编辑器 | 不支持 | 支持 |
| Dubbing | 视频多语言配音 | 不支持 | 支持 |
| API接口 | 程序化调用语音合成 | 不支持 | 支持 |
中文声音推荐
| 声音ID | 特点 | 适用场景 |
|---|---|---|
| Grace | 温柔女声,自然流畅 | 有声书、情感内容 |
| Daniel | 沉稳男中音,专业感 | 新闻播报、企业宣传 |
| Lily | 活泼女声,年轻感 | 短视频、社交媒体 |
| Brian | 温暖男声,亲和力强 | 教育内容、课程讲解 |
| Charlotte | 优雅女声,英伦风格 | 广告配音、品牌宣传 |
API 调用示例 (Python)
🔊 基础文字转语音
import requests
API_KEY = "your-api-key"
VOICE_ID = "pNInz6obpgDQGcFmaJgB" # Adam的语音ID
url = f"https://api.elevenlabs.io/v1/text-to-speech/{VOICE_ID}"
headers = {
"xi-api-key": API_KEY,
"Content-Type": "application/json"
}
data = {
"text": "你好,欢迎使用AI语音合成。这段声音由ElevenLabs生成。",
"model_id": "eleven_multilingual_v2",
"voice_settings": {
"stability": 0.5, # 稳定性 (0-1)
"similarity_boost": 0.75 # 相似度增强 (0-1)
}
}
response = requests.post(url, json=data, headers=headers)
with open("output.mp3", "wb") as f:
f.write(response.content)
print("语音文件已保存为 output.mp3")
调节参数的技巧
- Stability (稳定性):值越高语音越稳定但越平淡;值越低越有表现力但可能不稳定。朗读类内容建议 0.5-0.7,角色对话建议 0.3-0.5
- Similarity Boost (相似度):值越高越接近原始声音特征。克隆声音时建议 0.7-0.85
- Style Exaggeration (风格夸张):值越高声音情绪越丰富。广告配音建议 0.5+,新闻播报建议 0-0.3
- Speaker Boost:增强说话人特征,建议开启
提示:使用 SSML (语音合成标记语言) 可以实现更精细的控制,包括停顿、语速、音调、重音等。在文本中使用 ` ` 可以添加停顿。
同分类推荐