今年的Premiere Pro也開始支援自動上字幕的功能了,也就是Speech to Text的功能,但並非每一個軟體都已有此功能…
相信「語音智慧輸入」已經成為我們日常生活不可或缺的重要工具,可以說是每個人手機上的第二輸入法。而這種技術本來就該應用在影音製作上,雖然還無法帶來100分的效果,但至少也有個60~80分,即使只是用來生成字幕的「草稿」,對於上字幕的效率,已提升許多。
而大多數的專業剪輯軟體,即使沒有這種語音上字幕的功能,但應都已支援匯入外部的SRT字幕檔,今天就要介紹一下:如何借助外部的工具「pyTranscriber」來產生字幕的SRT。
影片介紹教學,下方還有詳細的文字介紹:
下載與開啟pyTranscriber
pyTranscriber運用了Google的語音引擎,是開發者免費開放給大家下載的。你要做的首先是連線至代碼大站Github進行pyTranscriber的下載。
進入頁面後,如果你很害怕「外星文」的東西,不必害怕,直接至下方找尋下載的區域。
分享這篇的同時,pyTranscriber是v1.5,該工具隨時都可能會再進行更新,就下載最新的版本通常不會有什麼問題。
點進去之後,可以大概看一下新版的一些功能更新內容,如果你也是英文盲,可以直接再拉到下方Assets的清單。
“installer”指的是安裝版,”portable”的意思就是「行動版」,指的不是指什麼手機平板,而是「免安裝」的意思,基本上程式開啟都不會有什麼問題。
大多數的使用者應該都是Windows或Mac的使用者(如果是Linux的user的話,你的能力應該也不需要看這一篇),選擇好自己的OS對應版本就可以直接下載。
下載之後解壓縮,圖示長這樣。
Mac可能遇到的問題
但因為我是用蘋果Mac的系統,安全性控管較嚴格,很多mac的朋友下載下來可能都會發現打不開的現象,最後敗性而歸。
回到下載的網頁,如果你看得懂下載清單上的英文說明,就知道為何。
簡單說明一下,因為該App並非由App Store下載的,系統會預防性的判定它不安全,所以可能會告訴你「這是不安全」(或毀損)的檔案,記得不要傻傻的丟到垃圾桶重新下載,你下載了一百次都會是一樣的狀況。
若是Catalina之後的作業系統版本,請你進到啟動台裡的「其他」類別,找到「終端機」,接著你可以假裝自己很厲害像個駭客一樣,在終端機內貼上:
xattr -cr Downloads/pyTranscriber.app
貼上之後按下Enter,好像什麼事都沒發生,這時再去開開看程式,就會發現原本「損毀」的程式竟然可以打開了。
此命令主要是清除該程式基於不安全理由所被附予的限制。因為程式一般下載下來直接解壓縮,應該都會在你的「下載」資料夾,如果你已經搬移程式,記得將上面的”Downloads”修改到程式所放置的路徑。
解除這些程式的限制之後,你可以把程式放到「應用程式」供日後使用。
生成SRT
開啟pyTranscriber之後其實就沒有什麼好介紹的了,直接點選”Select file(s)”選擇你的影片或是聲音檔案,並選擇要輸出的位置(Output Location)。
接著選擇語音所對應的語言引擎,以我們台灣人的口音,選擇zh-TW即可。
按下”Transcribe Audio / Generate Subtitles”(解碼聲音/生成字幕),就可以讓它去跑嚕。
輸出後會有純文字的txt檔案和帶時間碼的字幕檔srt,你只要將srt匯入至你的剪輯工具中即可使用,或是直接上傳到YouTube給指定的影片使用。
直接上YouTube進行校對
像我要上傳至YouTube的話,通常在輸出影片時不帶字幕,我選擇了使用YT外掛cc字幕的方式。
所以在這裡生成srt後,就會直接利用YouTube的後台上傳到影片中,並在線上修正錯字和斷點。這樣一來,除了不必再另外找上字幕的工具,YouTube後台的字幕編輯工具其實也不錯用,重點是免費、無廣告、Google還會幫你更新呀。
編輯校對完就可以直接儲存發佈,這個流程對於YouTuber應該是最順暢的流程。
是說我總覺得Google之後應該也會加入這個自動生成字幕的功能,畢竟語音辨識引擎是自家的,在YT上加入此功能可說是易如反掌。不過在那之前,pyTranscriber應該都會是我的好朋友。
注意事項
如前面說的,Google語音辨識的結果不可能會太理想,而且對於我們這種常常講一些特殊專有名詞或是穿插一些英文字眼的內容,不太可能成功辨識,所以切勿抱著太高的期待。
此外收音的品質或口齒的清晰度、語氣的步調,都會影響到準度,如果講話卡彈或是太「口語」效果都會打折,也可能結果慘不忍賭,不如自己重打…
因為是採用Google的語音引擎,所以使用時必須連上網路。若是在中國大陸使用,需要VPN連線翻牆,不然是連不上Google主機的。
[…] 之前介紹過 pyTranscriber 自動生成字幕,採用的是Google的語音辨識引擎,但該引擎畢竟不是專為語音字幕所設計,所以雖然有效果,但用字及分段的準確度極低,遇到比較特殊的內容或低品質的音檔,結果可能事倍功半、不如砍掉重打。 […]
請教:我轉換後只產生一個純文字TXT檔 沒有SRT檔
是否哪裡操作錯誤了?
請賜教 謝謝