AI 剪片流程的重點不是全自動,而是把影片壓成可操作的時間軸
AI Video Workflow
AI 剪片真正可用,是因為影片先變成「可編排的時間軸」
Threads 貼文分享一條實作流程:Claude + video-use 做語意剪輯,ElevenLabs Scribe 做字級時間戳,Remotion / HyperFrames 做片頭與過場,ffmpeg 合併與燒字幕。作者把每週約兩小時的剪輯工作降到約 30 分鐘。
Scribe:先把影音變文字
轉錄不是附屬功能,而是整條流程的基礎。字級時間戳、speaker diarization、聲音事件讓 LLM 可以在語意層決定剪點。
video-use:產生 EDL
browser-use/video-use README 的核心概念是:LLM 不直接看完整影片,而是讀轉錄與少量 timeline composite,產生剪輯決策、切掉贅詞與重錄片段。
Remotion:結構化動畫
用 React 產生片頭、章節過場與可重用模板,適合模組化、大量產出同一種內容的不同版型。
HyperFrames:HTML 到影片
留言提到 HyperFrames 更適合個人快速拍片:直接寫 HTML/CSS/JS 渲染影片,並有 agent-first skill 支援。
| 階段 | 工具 | 產物 |
|---|---|---|
| 錄影後處理 | ElevenLabs Scribe | 逐字稿、字級時間戳、聲音事件 |
| 語意剪輯 | Claude + video-use | EDL、刪贅詞、保留語意的剪輯策略 |
| 字幕修正 | LLM + ffmpeg | 合併斷字、去重複、修聽錯、燒字幕 |
| 片頭/章節 | Remotion / HyperFrames | React 或 HTML-based 動畫模板 |
| 輸出 | ffmpeg | final.mp4、橫式/直式版本 |
實務判斷:Remotion 適合產品化模板、批量變體、橫直式版型;HyperFrames 適合 agent 直接用 HTML/CSS/JS 快速生成動畫片段。兩者不是互斥,而是放在不同產製節奏。
導入順序:
- 先做 talking-head / 教學影片,因為 transcript-first 最有效。
- 把字幕清理、贅詞剪除、切點檢查自動化,先吃掉重複勞動。
- 片頭、章節、CTA 做成可重用模板。
- 橫式轉直式要人工定規則:保臉、保螢幕操作、或保字幕,三者常有取捨。
來源:
Threads: https://www.threads.com/@iamraven.tw/post/DYbO93Zjwdr
video-use: https://github.com/browser-use/video-use
HyperFrames: https://github.com/heygen-com/hyperframes
Threads: https://www.threads.com/@iamraven.tw/post/DYbO93Zjwdr
video-use: https://github.com/browser-use/video-use
HyperFrames: https://github.com/heygen-com/hyperframes