
一键翻译各类图片内文字,本项目旨在翻译那些不太可能有人专门翻译的图片,例如各种群聊、图站上的漫画/图片,让像我这样的日语小白也能大致理解图片内容。主要支持日语,同时也支持简繁中文、英文及其他 20 种小语言。

官方演示站 (由 zyddnys 维护): https://touhou.ai/imgtrans/
浏览器脚本 (由 QiroNT 维护): https://greasyfork.org/scripts/437569
安装
Docker Compose
services:
manga-image-translator:
image: zyddnys/manga-image-translator:main
container_name: manga-image-translator
command: server/main.py --verbose --start-instance --host=0.0.0.0 --port=5003
ports:
- 5003:5003
volumes:
- /vol1/1000/docker/manga-image-translator/result:/app/result
environment:
- OPENAI_API_BASE=https://aigptx.top/v1
- OPENAI_MODEL=gpt-4o-mini
- OPENAI_API_KEY=sk-xxxxx
restart: always
TIP:
此 Docker 镜像包含项目所需的所有依赖项和模型,镜像体积比较大需要注意网络,约为 15GB。
参数说明(更多参数设置建议去看文档)
命令:
--host HOST:主机地址(默认:127.0.0.1)
--port PORT:端口号(默认:8000)
--start-instance:是否应自动启动翻译器实例
--nonce NONCE:用于保护内部 Web 服务器通信的 Nonce
--models-ttl MODELS_TTL:模型在内存中的 TTL(秒)(0 表示永远)
翻译器:
OPENAI_API_BASE:OpenAI API 基础地址
OPENAI_MODEL:OpenAI 模型
OPENAI_API_KEY:OpenAI API 密钥
支持翻译器:

使用
浏览器中输入 http://NAS的IP:5003
就能看到界面

TIP:
感觉目前这个版本不是最新的,所以界面有很多奇奇怪怪问题,估计下一个版本体验会好一些。
选择翻译模型,如果上面和我一样设置 OpenAI 的这里选 Gpt3.5 就好了

上传漫画,点击进行翻译

等待完成翻译完成

单张翻译速度还是挺快的的,大概 40 秒左右

对比一下翻译前后效果

来到映射的文件夹,可以看到是将对话框抠出来处理的

如果效果不满意,可以调一下参数

效果比之前好一些了,文字不会出对话框了

这样我也测试了一下啊其他漫画

整体效果还是不错的,说实话基本能够满足翻译需求

总结
这个项目其实 2 年前就已经有了,目前我这个版本是 2025 年 3 月 1 号更新的。整体使用下来,翻译效果表现非常不错,但是存在各种各样 Bug ,而且我看截图这个 Web 界面也不是最新的,个人觉得未来可期吧。
有兴趣的可以去部署玩玩,不过镜像体积比较大这个需要特别注意。有人可能好奇,这个能不能批量翻译,测试过好像是不行的,只能单张翻译,不过速度还是挺快的。
综合推荐:⭐⭐⭐⭐(未来可期)
使用体验:⭐⭐⭐(简单方便)
部署难易:⭐⭐⭐(一般)︎
启动项目时,内存占用还是挺大的

启动翻译时,CPU 占用资源也不小
