BallonsTranslator漫画翻译工具使用体验

该工具的Github地址:https://github.com/dmMaze/BallonsTranslator

昨天下到了一个期待的漫画。因为比较新,所以还没有人翻译。现在越来越多的作品上标注了机翻。我就想着别人能机翻,俺寻思也行。于是在Github上找到了BallonsTranslator这个工具。

说来惭愧,机翻漫画是我之前研究过的一个方向,但是懒惰让我遇到瓶颈后,没有再继续下去。只知道大概的三个流程,提取文字,翻译,嵌字回填。看到这个工具有着3.3K的Star,光看文档就知道已经做的很完整,想来有些羡慕这些能真正做出来的人。

程序使用Python语言,基于PyTorch机器学习库,接入了OCR识别,翻译,嵌字,和修复工具,并且用PyQT写了一个页面。

一开始我尝试使用它的源码部署。结果有点悲剧,我机器的网络还是代理设置有点问题,下不下来他的Python依赖。有时切换代理后可以下载,但是速度只有可怜的160KB。

于是转而下载作者提供的win版部署包。看起来跟源码版也没有很多区别,只是可以从Google云盘直接拉下来,速度快了很多。

经过了其实很短暂,但是心里很漫长的等待,我终于下载好了。

看到里面的launch_win.bat,小手一点,开始启动!

果然不出意外的出意外了,因为有些包没下下来,启动失败。我想了一下,又把代理切了回去,这次嗖嗖嗖的下完了。虽然我也不知道为什么,看下载地址感觉可能是因为这个版本用的是阿里的mirror源地址吧。

这次是经过了漫长的等待,终于弹出了界面。BallonsTranslator的界面长这样:

分为左中右,中间是显示漫画的区域,左边是页面列表,设置菜单,右边是编辑工具。顶部的菜单栏里有打开文件夹的选项。打开文件夹后会自动生成几个目录,用于存放中间缓冲的内容和最后的结果。

顶部还有一个【运行】菜单,在这个菜单内选择一键翻译全部,或者仅仅翻译本页。

底部工具栏很隐蔽,但是是最重要的,翻译工具的选择。

我一开始选择一键机翻,速度巨快,效果巨差,令人大跌眼镜。原因就是因为选择的是默认的Google翻译,所以不太行。点进去后,它可以支持许多,许多的翻译工具。比如Chatgpt等等,需要填写对应接口地址和APIKEY,然后它来給Prompt,对每页句子进行翻译。然后对于一些专有名词,有一个表可以单独设置正则替换。这个我还没用过,应该是方便人名啊地名设定等保持一致。

我想起来春节时充值了一波Deepseek,但是程序里没有直接的DeepSeek的接口。不过DeepSeek是兼容Chatgpt的OpenAI接口的,所以直接按照issue里的做法,选择Chatgpt,但是使用Deepseek-chat模型,填写deepseek的服务地址。最后填上APIKEY即可。

但是,还是失败了,程序运行后,陷入了假死状态,Detecting,OCR,Inpainting三步的进度到了100%,然而Translating一直是0。那么显然翻译没在工作。再看控制台里的输入,果然问是问了,没有回应。

那没有回应是怎么回事呢?我和issue里的示例逐条比对,最后确认,是我的deepseek服务地址填错了,少了最后的一条斜杠【/】。

再次运行终于成功了,看到了图片一张张的打开,日文一个个变成中文,有种摘下眼镜,又带上眼镜那一瞬间的清澈的感觉。而且Deepseek的翻译效果不错,比起Google直接翻译要好多了。虽然跑的很慢很慢,白天大概1分钟才能回一次请求。但是这样显得进度条的进步更加令人期待了。

最终我花了5分钱翻译了一个80多页的漫画。比想像中贵一点,但是还好吧。至于效果,气泡里的字都替换掉了,难能可贵的是不在气泡里的他也能换,但是断句不是很完美,比如会把一个竖行的5个字,识别成3+2,然后两个翻译都不对。嵌字的话,效果比较一般,这也没办法。因为它识别文字是按矩形区域,但是有些气泡它是Z行的,文字像蛇一样转了几圈,这个只能通过人为增加空行把文字挤过去。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注