抖音视频中文字的方法

3 min

一些抖音视频不让下载,视频比较长的话,想把视频中声音中的文字提取出来就只能靠手打

这种方法太笨了,不合适,不是现代的办法

基本流程是:OBS录视频+FFMPEG提取音频+ASR

  • 首先使用OBS录制需要提取文字的抖音视频
OBS录制
OBS录制

使用OBS将需要提取文字的视频及音频录制下来,注意此时电脑不要播放其他的音频,不然会导致混淆

  • 使用ffmpeg提取音轨
ffmpeg
ffmpeg

使用ffmpeg将音轨从mp4封装文件中提取出来,主要指令如下

.\ffmpeg.exe -i D:\2.mp4 -vn -acodec copy output.m4a

如果觉得原速录制视频比较费时间,可以二倍速,三倍速录制,但是提取音频后,我们需要讲音频文件还原回原始速率,否则ASR效果比较差。命令如下:

.\ffmpeg.exe -i .\output.m4a -filter:a "atempo=0.5" output.mp3
  • 将音频文件发到服务器,使用一些python开源的ASR库进行文字提取 ASR

因为当前示例视频中的音频场景比较简单,如果涉及一些多人对话,会议类语音转文字,可以部署使用一些更加高级的ASR库,如paddle-ASR等。

  • 结果 result 结果如上图所示~

  • 发给大模型进行润色

如果你是大学生的话,我非常推荐你在这个周期里做一些记录,来留住这个瞬间。这真的是神给的能力。你想,你的记忆正常都是模糊的,你会很惆怅,总感觉想不准时间,但视频可以把一切都给清晰地留下来。

所以我后悔的事情有很多,但是有一点我绝对不会后悔,就是这么多年来,我一直保持着持续的记录,记录我的生活,记录我所看到的东西。在别人眼里可能像傻子,但是到了今天,再回来的时候,我就可以把过去和今天这条时间线交错到一起,这是别的任何形式都做不到的。

有人说,你可以不懂摄影,但一定要记住生活。拍得不好没有关系,没有记录下来才是最可惜的。因为很多事情过后,已经不能凭空想象起来了。当按下快门的那一刻,时间就停在了这里。影像的意义,在于把静心的瞬间变成一个永恒。当你回看的时候,回到当时的心情,它能让这段回忆变得更加具体。

希望可以帮到大家~