まず結論

ローカル優先のAI動画エディタは、ユーザーのメディア素材をワークフローの中心に置くべきです。AIは字幕確認、切り出し提案、視覚文脈、書き出し判断を助けられますが、データがどこへ行くのか、provider利用料を誰が支払うのかを明確にする必要があります。

これがClipComboの方向性です。

なぜローカル優先が重要なのか

長尺動画は公開前には私的な素材であることが多いです。クライアントとの通話、講座の下書き、ポッドキャストの生録音、社内ウェビナー、まだ外部ツールへ気軽にアップロードしたくない実験素材が含まれる場合があります。

ClipComboは、まずローカルメディアの取り扱いから始め、その上にワークフロー支援を重ねる設計を目指しています。

AIが担うべきこと

AIは編集の摩擦を減らすべきです。

編集の摩擦ClipComboの方向
使える区間を探す字幕と視覚キーフレーム文脈からAgentが切り出しを支援する。
字幕を直す単語頻度レビューで繰り返し出るASR誤認識を見つける。
ショート動画を準備する9:16フレーミングと書き出し制御を提供する。
まとめて公開する複数クリップを指定順に結合して書き出す。

AIが隠してはいけないこと

AIはコストやprovider境界を隠してはいけません。ClipComboの有料プランには、LLM、VLM、その他クラウドAPI利用料は含まれません。ユーザーのprovider keyを使うワークフローでは、そのproviderとの関係と費用は別です。

これにより有料プランはシンプルになります。ClipComboが販売するのはワークフロー能力です。

ファクトチェック日:2026年5月14日。