openai-image-gen¶
Skill 简介¶
openai-image-gen 是一个基于 OpenAI Images API 的自动化批量图像生成工具,旨在帮助开发者高效地生成和处理图像资源。该工具通过预定义的随机提示(prompt)生成高质量图像,并提供一个 index.html 画廊页面,方便用户快速浏览和管理生成结果。通过 OpenClaw Skill 的集成,用户可以轻松地使用命令行工具执行图像生成任务,而无需手动编写 API 请求代码。
OpenAI 的图像生成 API 提供多种模型支持,包括 DALL-E 2、DALL-E 3 以及 GPT 图像模型,这些模型在图像质量和生成方式上各有特色。openai-image-gen 的设计初衷是为了简化图像生成流程,让开发者无需深入了解 API 细节即可快速生成所需图像。这对于需要大量图像素材的开发者,如游戏开发、UI/UX 设计、机器学习数据增强等领域的用户,提供了极大的便利。
主要功能¶
openai-image-gen 提供了丰富的功能和参数配置,以下是核心功能的详细说明:
- 随机提示生成:工具内置了随机提示生成器,可以根据用户需求自动生成结构化但多样化的提示(prompt)。这些提示不仅能激发图像生成模型的创造力,还能确保生成的图像符合用户的预期。
bash
python3 {baseDir}/scripts/gen.py --prompt "ultra-detailed studio photo of a lobster astronaut" --count 4
- 多模型支持:支持多种 OpenAI 图像生成模型,包括 DALL-E 2、DALL-E 3 和 GPT 图像模型(如
gpt-image-1)。用户可以根据需求选择合适的模型,以获得最佳的图像生成效果。
bash
python3 {baseDir}/scripts/gen.py --model dall-e-3 --quality hd --size 1792x1024 --style vivid
- 灵活的参数配置:支持多种参数配置,如图像尺寸(size)、质量(quality)、背景类型(background)等。不同模型支持的参数值有所不同,工具会根据所选模型自动应用合适的默认值。
bash
python3 {baseDir}/scripts/gen.py --size 1536x1024 --quality high --out-dir ./out/images
-
批量生成与输出管理:支持批量生成图像,并自动将结果保存在指定的输出目录中。同时,生成一个
prompts.json文件,用于记录每个提示对应的图像文件。此外,还会生成一个index.html画廊页面,方便用户快速浏览所有生成的图像。 -
输出格式选择:支持多种图像输出格式,包括 PNG、JPEG 和 WebP。用户可以根据需求选择合适的格式,以满足不同场景下的使用需求。
bash
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp
- DALL-E 3 特有功能:DALL-E 3 模型支持
--style参数,用户可以选择vivid(超现实、戏剧化)或natural(更自然)风格,以获得不同风格的图像。
bash
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "serene mountain landscape"
使用场景¶
openai-image-gen 适用于多种开发场景,以下是一些典型的使用场景:
-
游戏开发:在游戏开发过程中,开发者需要大量的图像资源,如角色设计、场景设计等。通过该工具,开发者可以快速生成多样化的图像素材,节省大量时间和人力成本。
-
UI/UX 设计:UI/UX 设计师可以使用该工具生成不同风格的界面元素和图标,以快速迭代设计方案。同时,生成的图像可以直接用于原型设计和用户测试。
-
机器学习数据增强:在机器学习项目中,数据增强是提高模型性能的重要手段。通过该工具,开发者可以生成大量的图像数据,用于训练和验证模型。
-
艺术创作:艺术家和设计师可以使用该工具探索新的艺术风格和创作方向。随机提示生成功能可以帮助他们突破创作瓶颈,激发灵感。
-
市场营销:市场营销团队可以使用该工具快速生成广告素材和宣传图片,以满足不同的营销需求。
如何使用¶
安装与配置¶
- 前置条件:
- 安装 Python 3。
-
设置 OpenAI API 密钥环境变量
OPENAI_API_KEY。 -
安装 Python 依赖:
bash brew install python -
安装 OpenClaw Skill:
bash # 假设已安装 OpenClaw CLI 工具 openclaw install openai-image-gen
运行命令¶
-
基本命令:
bash python3 {baseDir}/scripts/gen.py open ~/Projects/tmp/openai-image-gen-*/index.html -
设置超时时间:
由于图像生成可能需要较长时间,建议在执行时设置较长的超时时间:
bash openclaw exec openai-image-gen --timeout=300 -
常用参数:
- 设置生成数量:
bash python3 {baseDir}/scripts/gen.py --count 16 - 选择模型:
bash python3 {baseDir}/scripts/gen.py --model gpt-image-1 - 设置提示:
bash python3 {baseDir}/scripts/gen.py --prompt "ultra-detailed studio photo of a lobster astronaut"
示例¶
示例 1:使用 DALL-E 3 生成自然风格的山景图像¶
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "serene mountain landscape"
示例 2:使用 GPT 图像模型生成透明背景的高质量图像¶
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp --count 8
执行上述命令后,图像将保存在指定的输出目录中,并在 index.html 页面中以缩略图形式展示。用户可以通过浏览器打开该页面,快速浏览和下载生成的图像。
总结¶
openai-image-gen 是一个功能强大且易于使用的图像生成工具,能够帮助开发者高效地生成高质量图像资源。其多模型支持、灵活的参数配置和批量生成功能,使其适用于多种开发场景。无论是游戏开发、UI/UX 设计,还是机器学习数据增强,该工具都能为用户提供强大的支持。对于需要快速生成和管理图像资源的开发者来说,openai-image-gen 是一个不可或缺的工具。