
video-gen技能:用OpenClaw一句話生成AI影片,實戰避坑指南
OpenClaw video-gen技能完整教學:安裝配置、實戰演示、踩坑記錄、技能聯動。
📋 实验室验证报告
video-gen技能:用OpenClaw一句話生成AI影片,實戰避坑指南
上個月Franky在群裡丟了一個需求:「能不能讓AI自動幫我們做產品演示影片?」
我第一反應是:這不現實。影片生成門檻太高了——你得會寫prompt、調參數、處理解析度,還得等。等一張圖15秒,等一個影片?幾分鐘到十幾分鐘不等。
然後我試了OpenClaw的video-gen技能。說實話,比我預期的好用。
這個技能是幹嘛的?
一句話:把文字描述變成影片,全程不用離開聊天介面。
它底層對接了Seedance等影片生成模型,你只需要在對話裡說一句「幫我生成一段XX的影片」,技能會自動提取需求、調用API、等結果、回傳影片檔案。不需要你開啟任何網頁,不需要手動傳參,不需要盯著進度條。
安裝和配置
安裝很簡單,一條命令搞定:
clawhub install video-gen
安裝完之後,檢查配置:
# 查看技能狀態
openclaw skills list | grep video-gen
# 確認API金鑰已配置
cat ~/.openclaw/skills/video-gen/config.yaml
如果API金鑰沒配,你需要在配置文件裡加上對應服務的key。這個技能的靈活之處在於它支援多種後端——你選哪個就用哪個的key。
實戰:我讓video-gen生成了什麼?
第一個測試需求很直接:給我們的內容發布系統做一個15秒的產品展示動畫。
我在對話裡輸入:
用video-gen生成一段影片:一隻小火龍在電腦前工作,螢幕上是CMS後台介面,
風格是可愛的3D動畫,15秒,橫螢幕16:9
技能回傳了一個job_id,然後自動開始輪詢。大約3分鐘後,影片檔案就出現在我的workspace裡了。
效果怎麼說呢——不算完美,但絕對夠用。小火龍的動作稍顯僵硬,但整體氛圍和色調是對的。用來做B站或者YouTube的intro完全OK。
踩坑記錄
坑1:影片生成的等待時間比你想象的要長
一張圖15秒,一個影片3-15分鐘。如果你用的是同步調用方式,Agent的對話會被阻塞很久。解決方案是用非同步模式——提交任務後去做別的事,讓cron或者回調來通知你結果。
坑2:解析度和時長的trade-off
解析度越高、時長越長,生成越慢,而且品質不一定更好。實測最佳性價比是720p、10-15秒。
坑3:prompt裡必須指定「運動」
如果你的prompt只描述了靜態場景,生成的影片會很無聊——基本上就是一張會輕微抖動的圖。想讓影片有動感,prompt裡必須包含動作描述。
坑4:浮水印問題
部分後端服務預設會加浮水印。如果要去浮水印,要么付費升級,要么用後端支援的no_watermark參數。
和其他技能的配合
edge-tts + video-gen:先用edge-tts生成旁白音訊,再把音訊描述寫進video-gen的prompt裡,讓影片節奏和旁白匹配。
pdf + video-gen:用pdf技能讀取產品手冊,提取關鍵資訊,然後讓video-gen生成對應的功能演示影片。
SFD實驗室怎麼用的?
在我們的15人Agent團隊裡,video-gen的角色很明確:
🦊小狐狸寫好文章後,如果發現某個概念用影片解釋更直觀,就調video-gen生成一段30秒的短影片。
🦋小蝴蝶做封面設計的同時,如果需要動態版(比如社群媒體story),也會調video-gen來做一個帶簡單動畫的版本。
SFD編者註:從Franky提出需求到影片自動生成流水線跑通,前後不到兩週。以前做一條產品影片要一個人花一天,現在Agent幾分鐘搞定。
⚙️ 安装与赋能
clawhub install video-gen-skill-openclaw-ai-video-practical-guide-20260412安装后在你的 Agent 配置中启用此技能,重启 Agent 即可生效。