Difference between revisions of "视频听写和字幕制作提高效率技巧"

From 爆料百科
Jump to navigation Jump to search
Line 1: Line 1:
 +
<translate>
 +
 
==字幕制作+听写,语音识别法效率提升 ==
 
==字幕制作+听写,语音识别法效率提升 ==
 +
</translate>
 +
 
=== Docker+谷歌语音识别+谷歌翻译,快速生成带有时间轴的原文或译文的草稿 ===
 
=== Docker+谷歌语音识别+谷歌翻译,快速生成带有时间轴的原文或译文的草稿 ===
 
# 用机器直接把视频生成带有时间轴的字幕文件(原文和翻译好的都可以生成,这个很成熟,谷歌能翻译的语种都能操作)
 
# 用机器直接把视频生成带有时间轴的字幕文件(原文和翻译好的都可以生成,这个很成熟,谷歌能翻译的语种都能操作)

Revision as of 08:24, 16 June 2020

字幕制作+听写,语音识别法效率提升

Docker+谷歌语音识别+谷歌翻译,快速生成带有时间轴的原文或译文的草稿

  1. 用机器直接把视频生成带有时间轴的字幕文件(原文和翻译好的都可以生成,这个很成熟,谷歌能翻译的语种都能操作)
  2. 合并成中英文的双语字幕文件(用Arctime等),机器生成的会有误差(用语音识别和翻译做的,外语的准确率会比较高,中文一般)
  3. 再由听写组和翻译组去在双语字幕的字幕文件(带时间轴的纯文本)的基础上去进行添加,如果听写组或翻译组觉得语音和翻译的反而影响到他们的工作效率,他们就可以直接删掉及其翻译的,留下时间轴,然后直接在字幕的时间轴后面添加文字,这样的话,后期字幕视频制作的战友会节省不少时间,直接调整字幕样式添加就行了
  4. 这样做的好处就是(1)省掉断句的步骤,(2)省掉字幕和视频组校正时间轴的时间?
  5. 类似这样的方法youtube上有示范,https://m.youtube.com/watch?reload=9&feature=youtu.be&v=EvBUgJfvnEI 简单来说流程就是:生成一个字幕双语或多语的草稿文件,然后开始听写组/翻译组的校正

pyTranscriber

这个软件还挺好用的。就是不如上面的Docker的方法功能强大,好处是操作更方便。缺点是使用次数有限制,也可以尝试一下。看哪个更好用。https://github.com/raryelcostasouza/pyTranscriber/releases 点下面的assets,选择自己的设备下载就行。 这个软件的缺陷是,哪天这个作者把自己的key删了,软件就不能用了。docker的绝对不会出现突然不能用的问题。

Tern字母小组工具

链接:https://github.com/1c7/Translate-Subtitle-File 此方法可以自动生成字幕和翻译字幕,还需要注册相应网站,获取Key。
它推荐的英文识别是微软和IBM(英文识别率高);

中文是阿里和腾讯(中文识别比较高,建议墙内战友慎用,以免被大数据了)

听写效率提升

此方法由Gtv:K.C. 提供,链接

一、音频上传在线听写

https://www.textfromtospeech.com/zh/voice-to-text/
测试视频链接:

https://gtv.org//?videoid=5ed4713cec8461185ff32003

注:路德节目(路博艾谈)测试发现,对路德识别准确率低,对博艾识别准确率高。此方式较试用电脑小白,只要拿到音频上传后,就可直接听写,也可以调节听写速度。

二、视频播放在线听写网站汇总

https://speechnotes.co/

https://voicetotext.org/

https://dictation.io/speech

https://www.speechtexter.com/