[派尼]我如何制作烤肉

这是一篇阐述我近期如何制作翻译视频,或者说烤肉的流程,以及一些相关的思考。更多是出于我记性不好的缘故,我打算把现阶段的事情总结一下,一方面可以促进我思考和进步,另一方面可能方便一段时间之后的我,帮我回顾目前的情况和方法。

首先先写一下重要的部分,就是目前我烤肉的流程。我是一个懒人,精简流程和尝试新工具对我来说并不是经常去做的事,所以我的流程比较繁琐。我的出发点是可用、稳定、便宜,许多部分都是从别人那里学了个大概。肯定会存在犯蠢和违背出发点的情况。

但第一步肯定是要得知自己的切片对象是否允许切片,在这里假定的是没有宣言“禁止切片”的情况。

对于烤制现有切片的流程:

首先肯定是下载切片,这一步有许多方法。从YT下载切片的话有对应的下载网站,但从很多其他地方下载的话不一定有方便的下载方式。我的解决办法是付费购买下载软件idm。起初的购买目的是为了更好管理我的下载,但后来发现下载视频很好用,就用来下视频了。idm的浏览器插件支持几乎在任何视频网站上下载视频,这包括直接下载twitch上的clips。这也是为什么我去年制作了很多一分钟以内的烤肉,这些全是我直接下载的twitch clips。twitch是许多vtb进行直播的平台,平台提供了一个可以随时剪辑出一分钟以内片段的“clip”功能。因此假如你和我一样,想制作切片但并没有充裕的时间去把主播的直播都看下来,你可以去直接下clips做烤肉(又或者参考直播期间观众们制作的clips去锁定精彩内容的时间点)。但对于idm的使用还有更多的事情要讲,这个之后会再提及。

获得切片视频后的下一步就会和后面讲的内容有重叠,可以直接跳转至后方。

对于制作自己切片并烤肉的流程:

找切片的点

先讲怎么开始切片。最普通的办法肯定是把直播都看下来了,如果没时间看的话,可以参考我知道的一位知名烤肉man的做法,开后台播放听。前文提到可以参考clips出现的时间点去找内容重点,不过我比较的一根筋,要么直接用现有的clips要么还是自己的看重点。因为直播观众在意的点不一定是我们中国人在意的点,有一些有趣的事情前后发生的过程可能超过一分钟,也可能导致没有人做对于时间的clips。

所以我一般是两种思维去看录像,第一种思维是进度条每三五分钟听十秒,如果听到有趣的单词就前后看一看是否能做成切片;第二种思维是vtb特有的情况,因为皮套的表现力比较有限,基本上当一个vtb要讲什么特殊的事情时,都会选择放大自己的皮套/切换皮套形态的方式。进度条一般都会有缩略图,你可以看缩略图在哪个时间点出现了vtb脸贴很近的片段,你可以看一看能否做成有趣的切片。

下载录播

但说这么多,切片第一步还是找到录像。如果你能上twitch,你可以用idm下录像。如果你打算切的片时间很短,那可以考虑使用twitch的clip功能,可以先切出你要的部分(最长一分钟)之后使用idm下载自己的切片。又或者采用我最近发现的特性,twitch在clip页面中提供了从你点clip的时间点之前的88秒(直播中)/85秒(录播中)到时间点后的2秒(直播中)/5秒(录播中),在这个界面下其实可以直接用idm下载这90秒的内容,然后再用剪辑软件处理。

那肯定有同学会说,上不了twitch怎么办呢?其实很多有知名度的v都在b站有录播搬运,你可以下载这些搬运的录播进行切片制作,我的一些几分钟时长的切片就是使用搬运的录播制作的。使用搬运的录播还有一个好处,就是别人可以搬运的录播,那你制作这个录播的切片原则上也不会有需要考虑的限制。但使用idm下载b站视频时有个问题,就是在b站视频和音频是分成两个同名的m4s格式文件的,如果要下载还是建议使用专门对应的下载器比较好。

剪辑,或者……

我英语并不优秀,一般得到原始片段的时候都是我“大概听明白了是什么内容,并且找到了有内容的点”。如果遇到一个片段的内容比较简单易懂,那我会直接进行剪辑步骤。但如果遇到片段里面有些不太听得明白的部分怎么办呢?

比较简单的办法是加一个同好水友群,把你不懂的部分剪出来发在群里让别人帮你看。但假如你像我一样不排斥ai工具,你可以使用语音识别跑一遍,看看跑出来的语句你能否理解。涉及到俚语(尤其vtb这个领域很多网络词汇或者俚语)可以结合录播提供的弹幕——chat们讨论的话题去理解。关于ai语音识别的事情下一个环节会提到。

在如何剪辑视频方面,没有办法讲的清楚,我会说一说简单的部分。我使用的剪辑软件是达芬奇的免费个人版,出于两个原因,其一是我倾向于正版使用软件,pr或者fcp肯定是最泛用的视频剪辑软件,我个人认为免费的正版比盗版是要更符合我的道德倾向,而且达芬奇个人免费版提供的功能也足够我制作目前我水平的内容。其他软件当然也能制作切片,但我没用过,无法评论。

我比较看重的是达芬奇提供了:很容易操作的画面放大缩小旋转、放大缩小旋转的k帧变化、简单易用的打码方式、实用性很强的滤镜。举个例子,视频“[Renn中字]让我闻闻你的气味”( BV1aD42157qN )中,下图我需要遮住chat去放一些我打算放的图标,但Renn使用的chat的背景板居然是一块渐变色。这时候达芬奇非常容易就可以实现把chat给遮盖上,并且支持把遮盖的颜色也设置成渐变色。

又比如说这一段,Renn的嗅探。这一段由于面捕跟踪做得很好,Renn的表情和头部动作非常灵动,因此我让画面跟着Renn的头一起动去表达这种灵动感。但我同时又很懒,我的画面移动是直接k了几帧实现的,并没有使用跟踪功能。这导致画面移动非常生硬,我于是添加了一个画面运动抖动的功能,将抖动设置得比较小,这时画面的移动就自然了许多。而达芬奇提供了非常多的设置选项,如果我想的话可以再把画面移动调得更加丝滑。

于我而言,我以前还有做视频的时候会用这些功能,我现在还需要这些功能。

如何得到字幕原文/如何打时间轴/如何得到初始字幕文件

在我最开始译制视频“【Gloggles(Glarses)中字】青蛙侠组青蛙键盘”( BV1PA411P7HR )时,由于这是一个YT上的视频,我于是下载了YT自带的“自动识别字幕”,打算拿来直接用。结果证明选择一个口齿伶俐的黑人作为第一次烤肉的对象是非常愚蠢的事情。自动字幕识别不明白起码一半的视频内容,这一期视频的原稿,我是结合着自动识别的垃圾,用听译的方式完成的。现在看回去感觉翻译质量和正确率都不堪回首,而这三分钟的视频我印象里是花了四个小时去译制的(记性如此差劲的我还能记得花了多久,可想而知这件事当时有多折磨)。

长话短说,我目前使用的方案是弹弹play。感谢游戏驴子翻译组 @肉丸意面小分队 让我得知了这一种方法,具体参考https://t.bilibili.com/780279065488654402 。弹弹play是一个电脑上的视频播放软件,一般的用途是拿来看番剧,因为可以自动匹配网络上现成的字幕。弹弹play集成了openai的whisper语音识别功能,可以识别视频里的声音并输出一个字幕文件srt。使用whisper模型的正确率其实非常高,在没有背景音乐的情况下可能每一分钟里只会出现一个时间轴打错的问题,每三分钟出现一个单词错误。当然,有背景音乐的视频就会比较折磨,但肯定比听译要爽多了。whisper模型已经是目前免费语音识别模型(重点果然是免费吗)里效果比较好的了。再次感谢肉丸意面组。

如何做字幕

软件

一般到这一步推荐的软件是aegisub和arctime二选一,我的选择是arctime,因为界面看起来比较现代。最主要的原因有二,其一是我最开始在没有使用弹弹play的whisper之前,我的初始字幕是通过arctime的语音识别获得的。但识别正确率不如whisper,还要消耗积分,因此不建议用arctime的语音识别。

打开arctime,拖入切片和srt字幕,就可以开始制作字幕了。习惯上第一步是校对一遍ai给的字幕,因为肯定会有时间轴打的不好和识别错词的情况。如何处理搞不清楚的词参考前文“比较简单的办法是加一个同好水友群,把你不懂的部分剪出来发在群里让别人帮你看。但假如你像我一样不排斥ai工具,你可以使用语音识别跑一遍,看看跑出来的语句你能否理解。涉及到俚语(尤其vtb这个领域很多网络词汇或者俚语)可以结合录播提供的弹幕——chat们讨论的话题去理解。”

在调整好英文字幕后,你可以直接右键字幕点击“从这里开始翻译”,或者向我一样制作双语字幕,则是点击“语言处理→为所有字幕块创建用于翻译的副本”。这时字幕就会变成上图的状态,出现大字幕和小字幕。

字体

秉持着使用免费的正版的出发点,我使用的字体一般是寒蝉全圆体和霞鹜文楷,这两个字体甚至允许免费商用。使用圆体是因为我有轻微的阅读障碍,不是圆体的话我读起来很慢。顺带一提我最目前喜欢的字体是“方正筑紫A圆体D”,可读性很好,日语字词支持很好,不过是一个付费字体。你当然也可以用鸿蒙sans和misans,但做vtb切片字幕还是倾向与在可读性和亲切度之间找个平衡点更好。

压制

我的习惯是达芬奇压制出视频后用arctime再压一次,但你也可以把arctime的字幕导入到你的剪辑软件里面去压制,这样的话视频只经过一次压制,清晰度会更好。其实最关键的是aegisub和arctime几乎没有什么字幕的特效可言,很多大家看到的字幕很灵动的官切都是在pr甚至ae中完成的,因此我非常推荐想要做出好的视觉效果的同学把字幕导回到剪辑软件里面继续处理。不过我没有做特效字幕的经验,以后有机会接触再去讲这一部分的内容了。

上传

上传本身没有什么要说的,但有不少可以提到的点。

0、封面

切片封面一般是需要专门制作的,我使用的软件是kde项目里的krita,也是出于使用免费正版的理念选择的。Krita是老友推荐给我的,我用了之后感觉比较接近于一个功能缩水版的csp,肯定是完全不如ps的了。但krita不花钱,吉祥物还是一只很可爱的机械福瑞。

什么?机娘?!福瑞?!(krita宣传图的插画师:@钛山-TysonTan )

于是我推荐你也用krita。目前唯一的怨言是没有提供sai的那种每画一笔就保存一个临时文件的功能,在意外关闭文件之后就没有办法后悔了。

还有一个很蠢的点,由于kde项目里的软件都是针对linux的,所以windows版本会有一点兼容性的问题。最常见的问题是后缀kra的图像文件不能显示出缩略图,解决问题需要去krita官网下载一个“windows兼容组件”,安装后就能显示缩略图了。

顺带一提,做vtb切片封面经常用到给人物或者文字描边的功能,在krita里,描边的功能是:右键你想要描边的图层(如果是描边人物最好先把人抠出来)→选择图层样式→勾选描边,然后根据你的需要调整参数即可。

1、我的切片标题格式是源于我最开始做烤肉,翻译的是Glarses的视频,而Glarses本来是有一个授权搬运翻译的烤肉man。而当时烤肉man长时间不更新,我于是打算自己去接着做,模仿着他的格式去命名我的烤肉;

2、制作双语没有必要,我是因为看了比较久的LTT和ElectroBOOM,辉光字幕组和罗兹都是双语字幕。而我正好开始使用语音识别功能,以防有些识别错误我没有纠正出来,我于是就保留了英文字幕。

3、根据前文提到的一位我知道的知名烤肉man的说法,tag建议是把vtuber和VTuber和Vtuber都打上;

4、一般b站的up主发布视频都会设定在晚上六点到九点的区间,而vtb的观众作息时间成谜,我的建议是晚上十点以后再发。