Vidu 最近推出了幾個強大的新功能:支援首尾幀生成與參考圖片導入,大幅提升影片的畫面穩定度與人物物件一致性。這篇文章將帶你一步步完成一支 AI 動畫影片,並搭配 Midjourney 與 ComfyUI,實現從圖像生成到影片與音效整合的完整製作流程。
文章大鋼
Step 1:構思影片故事與畫面

假設我們想製作一支「小男孩拿馬克杯挖沙坑」的短片,這就需要以下圖片素材:
- 小男孩在挖沙子的畫面
- 小男孩手上拿著馬克杯
Step 2:使用 GPT 與 Midjourney 生成圖片

- 使用 GPT 協助生成提示詞(Prompt):
- 例:a little boy digging sand on the beach, holding a mug, sunlight, white short-sleeve shirt
- 在 Midjourney 指定直式比例:
- 輸入
--ar 9:16
可指定圖片為直式格式,適合用於手機短影音。
- 輸入
- 選擇一張畫面風格理想的圖片後:
- 修改第二張圖片的提示詞,讓風格更接近第一張(可提及陽光、衣服顏色等)
- 貼上第一張圖的連結,提升風格與構圖的一致性
Step 3:修圖處理(手指與物件細節)

若生成圖片中有不自然的部分,例如:
- 手指形狀怪異
- 馬克杯樣式與預期不符
可以使用 ComfyUI 的工作流進行修復:
- 使用「手指修復」模組改善手部細節
- 使用「物品遷移」功能替換手上的馬克杯為指定款式
Step 4:進入 Vidu 製作影片

- 前往 Vidu 官網,新用戶完成問卷可獲得 120 點數。
- 點選「圖生視頻」功能頁面:
- 上傳「首幀」與「尾幀」圖片
- 輸入影片提示詞(與 Midjourney 使用的類似)
- 點擊「創作」後,即可完成一段約 5 秒的影片
Step 5:使用參考圖生成更穩定的影片

- 進入「參考生視頻」功能頁面
- 上傳一張背景圖片(如沙灘)
- 上傳主體人物圖片(小男孩拿馬克杯)
- 若有多角度圖片也可一併上傳,提高畫面一致性
- 設定提示詞、鏡頭運動、寬高比
- 點擊「創作」,影片即可完成,且畫面更穩定、內容一致
Step 6:加入自訂音效

- 前往「音效生成」功能頁
- 輸入提示詞(例:海浪聲、海鷗聲)
- 可設定每段音效的秒數與出現時間
- 點擊「生成」,即可疊加多段聲音,讓影片更生動
用 AI 打造高品質創作變得更簡單了!
透過 Vidu 的新功能結合 Midjourney 與 ComfyUI,不需要專業動畫背景也能製作出一致性高、畫面穩定又有創意的動畫影片。從圖片生成、細節修復到影片與音效整合,這些工具讓創作過程更直覺也更高效。趕快動手試試看,創造出屬於你的 AI 動畫吧!