iSkills 原始文档
🔊

sag

OpenClaw Skill

ElevenLabs text-to-speech with mac-style say UX.


sag

Skill 简介

sag 是一个基于 ElevenLabs 文本转语音(TTS)技术的开源工具,旨在为开发者提供强大且灵活的语音生成功能。它的设计灵感源自 macOS 的 say 命令行工具,但功能更为强大和现代化。通过 sag,开发者可以轻松地将文本内容转换为高质量的语音,并在本地进行播放。这不仅简化了语音生成的过程,还为各种应用场景提供了丰富的定制选项,例如不同的语音风格、语调和情感表达。

在现代应用中,语音交互变得越来越普遍,从智能助手到有声读物,再到虚拟角色的对话生成,语音功能无处不在。然而,实现高质量的语音合成往往需要复杂的配置和昂贵的第三方服务。sag 通过集成 ElevenLabs 的先进技术,提供了便捷的接口和丰富的功能,帮助开发者快速集成高质量的语音功能,同时保持较低的成本和较高的灵活性。

主要功能

sag 提供了多项核心功能,使其在众多文本转语音工具中脱颖而出:

使用场景

sag 的灵活性和强大功能使其适用于多种开发场景:

  1. 智能助手开发
    在开发智能助手时,sag 可以用于生成自然流畅的语音回复,提升用户体验。通过自定义语音标签,开发者可以模拟不同的角色和情感,使对话更加生动。

  2. 有声读物制作
    对于有声读物制作,sag 提供了高质量的语音合成功能,支持多种语言和语音风格。开发者可以轻松地将文本内容转换为音频文件,并进行后期处理。

  3. 虚拟角色对话生成
    在游戏或虚拟现实应用中,sag 可以用于生成虚拟角色的对话。通过使用不同的语音标签,开发者可以模拟角色的情感变化和个性特征,增强沉浸感。

  4. 教育和培训
    在教育和培训领域,sag 可以用于生成教学音频或语音提示。通过自定义语速和音调,开发者可以优化语音的可懂度和舒适度。

  5. 自动化报告和通知
    对于需要定期生成报告或发送通知的应用,sag 可以用于将文本内容转换为语音,并通过电话或语音消息进行发送。

如何使用

安装

sag 可以通过 Homebrew 进行安装:

brew install steipete/tap/sag

配置

在使用 sag 之前,需要设置 ElevenLabs 的 API 密钥。可以使用以下命令设置环境变量:

export ELEVENLABS_API_KEY=your_api_key_here

或者,在命令行中直接指定 API 密钥:

sag -k your_api_key_here "Your text here"

基本命令

bash sag "Hello there"

bash sag speak -v "Roger" "Hello"

bash sag voices

bash sag prompting

示例

示例 1:生成语音文件

sag -v Clawd -o /tmp/voice-reply.mp3 "Your message here"

这条命令将使用名为 Clawd 的语音模型,将文本 "Your message here" 转换为语音,并保存到 /tmp/voice-reply.mp3 文件中。

示例 2:使用语音标签

sag "[whispers] keep this quiet. [short pause] ok?"

这条命令将生成一段低语语音,并在 "keep this quiet""ok?" 之间添加一个短暂的停顿。

总结

sag 是一个功能强大且易于使用的文本转语音工具,专为开发者设计。它集成了 ElevenLabs 的先进技术,提供了丰富的功能和灵活的定制选项,适用于智能助手、有声读物、虚拟角色对话等多种应用场景。通过 sag,开发者可以快速集成高质量的语音功能,提升应用的用户体验。

无论是需要自然流畅的语音合成,还是希望模拟不同的情感和风格,sag 都能满足开发者的需求。对于那些希望在应用中加入语音功能,但又不想花费大量时间和资源的开发者来说,sag 是一个理想的选择。

查看原始 SKILL.md 生成于 2026-03-12 · 内容由 AI 辅助生成