iSkills 原始文档
🔉

sherpa-onnx-tts

OpenClaw Skill

Local text-to-speech via sherpa-onnx (offline, no cloud)


sherpa-onnx-tts

Skill 简介

sherpa-onnx-tts 是一个基于本地计算的文本转语音(Text-to-Speech, TTS)工具,其核心依赖于 sherpa-onnx 的离线命令行接口(CLI)。与依赖云服务的 TTS 解决方案不同,sherpa-onnx-tts 完全在本地运行,无需依赖互联网连接,从而确保了数据隐私和离线可用性。该 Skill 使用 OpenClaw 框架进行集成,旨在为开发者提供一种简单、高效的本地语音合成方案,适用于各种需要语音输出的应用场景,如智能助手、语音导航、阅读辅助工具等。

sherpa-onnx-tts 的主要优势在于其离线运行的能力,这意味着用户可以在没有网络连接的环境中使用该工具。此外,它还支持多种语音模型,用户可以根据需求选择不同的声音,从而实现更自然的语音合成效果。

主要功能

1. 本地离线运行
sherpa-onnx-tts 完全在本地运行,不需要依赖云服务或互联网连接。这不仅提高了数据隐私性,还能在网络不稳定或不可用的环境中正常工作。

2. 多平台支持
该 Skill 支持多种操作系统,包括 macOS(Darwin)、Linux 和 Windows(win32)。无论开发者使用哪种平台,都可以方便地集成和使用 sherpa-onnx-tts。

3. 多种语音模型选择
sherpa-onnx-tts 支持多种语音模型,用户可以根据需求选择不同的声音。例如,开发者可以选择“en_US-lessac-high”模型来获得高质量的英语语音输出。如果需要其他语言或风格的声音,可以从 sherpa-onnx 的 tts-models 发布页面下载相应的模型。

4. 可配置的模型文件
如果模型目录中包含多个 .onnx 文件,用户可以通过设置环境变量 SHERPA_ONNX_MODEL_FILE 或使用命令行参数 --model-file 来指定要使用的模型文件。这为开发者提供了更大的灵活性。

5. 自定义数据目录
用户可以通过命令行参数 --data-dir 来指定数据目录,从而覆盖默认设置。这对于需要自定义语音合成参数或使用自定义数据的开发者非常有用。

6. 易于集成的命令行接口
sherpa-onnx-tts 提供了一个简单易用的命令行接口,开发者可以通过脚本或命令行工具轻松地调用该工具,实现语音合成功能。

使用场景

1. 智能助手开发
在开发智能助手时,sherpa-onnx-tts 可以作为本地语音合成模块,提供高效的语音输出功能,而无需依赖云服务。

2. 语音导航应用
对于需要离线语音导航的应用,sherpa-onnx-tts 提供了可靠的本地语音合成解决方案,确保在无网络环境下也能正常工作。

3. 阅读辅助工具
在开发阅读辅助工具时,sherpa-onnx-tts 可以将文本内容转换为语音,帮助用户更方便地获取信息。

4. 本地化语音应用
对于需要本地化语音输出的应用,sherpa-onnx-tts 支持多种语音模型,开发者可以根据目标用户群体选择合适的语音模型。

5. 数据隐私敏感应用
在处理敏感数据时,sherpa-onnx-tts 的离线运行特性可以确保数据不外泄,满足高数据隐私要求。

如何使用

安装

  1. 下载运行时
    根据你的操作系统,下载相应的运行时文件并解压到 ~/.openclaw/tools/sherpa-onnx-tts/runtime 目录。例如,在 macOS 上:

bash wget https://github.com/k2-fsa/sherpa-onnx/releases/download/v1.12.23/sherpa-onnx-v1.12.23-osx-universal2-shared.tar.bz2 -O sherpa-onnx-runtime.tar.bz2 tar -xjf sherpa-onnx-runtime.tar.bz2 -C ~/.openclaw/tools/sherpa-onnx-tts/runtime --strip-components=1

  1. 下载语音模型
    下载所需的语音模型并解压到 ~/.openclaw/tools/sherpa-onnx-tts/models 目录。例如:

bash wget https://github.com/k2-fsa/sherpa-onnx/releases/download/tts-models/vits-piper-en_US-lessac-high.tar.bz2 -O model.tar.bz2 tar -xjf model.tar.bz2 -C ~/.openclaw/tools/sherpa-onnx-tts/models --strip-components=1

  1. 配置环境变量
    更新 ~/.openclaw/openclaw.json 文件,添加环境变量配置:

json5 { "skills": { "entries": { "sherpa-onnx-tts": { "env": { "SHERPA_ONNX_RUNTIME_DIR": "~/.openclaw/tools/sherpa-onnx-tts/runtime", "SHERPA_ONNX_MODEL_DIR": "~/.openclaw/tools/sherpa-onnx-tts/models/vits-piper-en_US-lessac-high" } } } } }

配置

sherpa-onnx-tts 工具的路径添加到系统的 PATH 环境变量中:

export PATH="~/.openclaw/tools/sherpa-onnx-tts/bin:$PATH"

示例

示例 1:基本用法

在终端中运行以下命令,将文本转换为语音并保存为 tts.wav 文件:

sherpa-onnx-tts -o ./tts.wav "你好,这是一个本地文本转语音的示例。"

示例 2:在 Windows 上使用

在 Windows 命令提示符中运行以下命令:

node %USERPROFILE%\openclaw\tools\sherpa-onnx-tts\bin\sherpa-onnx-tts -o tts.wav "Hello from local TTS."

总结

sherpa-onnx-tts 是一个功能强大且易于集成的本地文本转语音工具,适用于各种需要语音输出的应用场景。其离线运行特性、多平台支持和多种语音模型选择,使其成为开发者在构建智能应用时的理想选择。无论是智能助手、语音导航,还是阅读辅助工具,sherpa-onnx-tts 都能提供高效、可靠的语音合成服务。开发者可以根据具体需求选择合适的语音模型,并通过简单的命令行接口快速实现语音输出功能。对于注重数据隐私和离线可用性的应用,sherpa-onnx-tts 无疑是一个值得考虑的选择。

查看原始 SKILL.md 生成于 2026-03-12 · 内容由 AI 辅助生成