Curation AI動画量産構造動画構成最適化構造脳反応予測構造 TikTok Shopify

AIでバズを設計する方法

X2日前

要約

直近90日で最も見られた短尺5,000本を分析すると、バズるかどうかはテーマや撮影手段ではなく構造で決まっていた。上位1%は①最初の1.8秒で動きを見せて視線を固定し、②2.3秒の一定リズムで編集し、③感情を1つに絞り、④1フレーム1主役で迷わせず、⑤音と映像を0.1秒以内で同期し、⑥見せ場を全体の65〜75%に置く。6つ中4つ以上が共通し、全て揃うと50万回超の外れ値になりやすい。

2026年末までに、ソーシャルメディアでミリオネアになる18〜25歳は驚くほど増える。彼らと自分の違いは、アルゴリズムをハックしてバズらせる力だ。

直近90日で最も視聴された短尺5,000本をAIに入れた。アクション編集、シネマ風、プロダクト公開、ブランド、ファン制作予告など、指が止まった動画だけを集めた。

狙いは単純で、上位1%が下位99%と何が違うかを見抜くこと。答えは6つのパターンだった。高パフォーマンスは最低4つを満たし、6つ全部は50万回超の外れ値を引いた。

これらは話題やジャンル、AIかカメラかとは無関係だ。構造の話だから再現できるし、設計できる。ここから6パターンを並べるので保存して使え。

パターン1は「1.8秒ロック」。冒頭1.8秒で動きで注意を掴む。テキストや質問ではなく、カメラの寄り、被写体の侵入、衝突など。静止のロゴやタイトルは負ける。

パターン2は「2.3秒リズム」。上位は平均2.3秒でカットし、一定の脈がある。不規則なテンポは40〜60%弱い。ショット単体で考えず、2〜3秒の呼吸で揃える。

パターン3は「感情は1つ」。好奇心、憧れ、驚き、笑い、緊張など1レーンに固定する。笑いも学びも呼びかけも混ぜると最悪。粗くても感情が明確な方が伸びる。

パターン4は「1フレーム1主役」。毎フレームで支配的な要素は1つだけ。ごちゃつくと完了率が平均70%下がる。短尺は“プロっぽい情報量”より、目の着地点の明確さだ。

パターン5は「音が映像に着地する」。0.1秒以内に音のイベントがカットや衝突に一致する。ズレると共有が落ちる。パターン6は「70%の見せ場」で、65〜75%地点に報酬を置き、残りで余韻と再視聴・共有を作る。

2026年末までに、ソーシャルメディアでミリオネアになっているはずの18〜25歳の数は、とんでもないことになる…。

彼らとあなたの唯一の違いは、アルゴリズムをハックしてバズらせる能力だ。

直近90日で最も視聴された短尺クリップ5,000本をClaudeに入れた。アクション編集。シネマ風ショート。プロダクト公開。ブランドコンテンツ。ファン制作の予告編。何百万人もの指をスクロール途中で止めた動画だ。

目的はシンプルだった。上位1%が下位99%と比べて共通して持っているものを見つけること。

答えは6つのパターンだった。高パフォーマンスのクリップは少なくとも4つを共有していた。6つすべてを持つクリップは、50万回以上の再生を引っ張る外れ値だった。

これらのパターンはテーマの話ではない。ジャンルの話でもない。AI生成かカメラ撮影かも関係ない。構造の話だ。つまり繰り返せる。つまり設計できる。

これがその6つだ。保存しておけ。

パターン1：1.8秒ロック上位は最初の1.8秒で注意を引っ掛けていた。テキストでも質問でもない。動きだ。カメラの押し込み。被写体がフレームに入ってくる。衝突。指がスクロールを続けるか決める前に、視覚的に動く何かが起きている。

TikTok自身のデータもこれを裏付ける。上位動画の63%は、最初の3秒以内に重要なビジュアルを出している。だが上位1%はさらに先を行く。脳が「見る／見ない」を判断する前にロックする。

多くの作り手のミスは、タイトルカード、ロゴ、静止画から始めることだ。指は好奇心より速い。最初の1.8秒で何も動かなければ負けだ。

設計方法：HiggsfieldのSeedance 2.0に出すプロンプトでは、最初のカメラ指示が最重要だ。「フレーム1からゆっくり押し込む」「被写体が左から入り、速い追従ショット」など、即座に動く指示を入れる。静的な導入はシネマっぽくてもスクロール戦争に負ける。

パターン2：2.3秒リズム上位クリップの平均カット間隔は2.3秒だった。ランダムではない。リズミカルだ。視聴者は言語化できなくても脈として感じる。音楽と同じで、一定のビートは期待を作る。各カットが小さな報酬になり、次のカットまで視聴者を連れていく。

ペースが不安定なクリップは40〜60%低かった。長い保持の後に急に速いカットを入れると、視聴者の内的なタイミングが崩れる。脳は予測できないと離脱する。

ミス：各ショットを単体の瞬間として扱うこと。ショット同士が一緒に呼吸する必要がある。1カット2〜3秒を全体で一定に。リズムがあるから、15秒が意図を持ったものに見える。

設計方法：Seedance 2.0は最大15秒のマルチショットを自然な遷移つきで生成できる。Claudeがプロンプトを書くなら、単発の場面ではなくショット列として構造化する。「ショット1：2.5秒、ワイド、ゆっくり右パン。ショット2：2秒、ミディアム寄り、固定。ショット3：2.5秒、クローズアップ、ゆっくり押し込み」。遷移はモデルが処理する。

パターン3：感情は1つ上位は1つの感情を選び、最後まで維持した。好奇心。憧れ。畏敬。ユーモア。緊張。面白い＋感動＋情報提供のように混ぜた動画は、データセットで最も悪かった。視聴者は「今何を感じればいいか」を知る必要がある。感情が混ざると混乱し、混乱した視聴者は共有しない。

感情の意図の明確さは、制作の綺麗さより成績を予測した。粗く見える動画でも、感情の一本筋が通っていれば、磨かれたがトーンが混ざった動画より勝つ。

ミス：1本に複数メッセージを詰め込むこと。「感動的で、教育的で、さらに行動喚起も」。1つに絞れ。残りは次の動画へ。

設計方法：Claudeへの指示で、各バッチの感情レーンを指定する。「10本すべて好奇心レーン。ユーモアなし。憧れなし。視覚的な見せ方と未解決の問いで好奇心だけ」。一貫した指示なら、Seedance 2.0の映像もその方向に揃う。

パターン4：1フレーム1主役上位のフレームは、支配的な要素が1つだった。2つでも3つでもない。1つの被写体が、明確に照明され、明確にフレーミングされ、他は従属している。

ごちゃついた構図のクリップは、平均で完了率が70%低かった。視線の着地点が必要だ。3つの要素が同じ重みだと目が迷い、目が迷うと指が動く。

ミス：「プロっぽく」見せるために情報を詰め込むこと。短尺ではシンプルが勝つ。被写体は1つ。光源は1つ。焦点は1つ。

設計方法：プロンプトの順序が効く。「シネマ風クローズアップ、浅い被写界深度、被写体1人を中央、背景は柔らかいボケ」など、1要素支配を明示する。被写体→カメラ→ムードの順で定義すると、自然に主役が立つ。

パターン5：音が映像に着地する上位は、音のイベントが映像の切り替えと0.1秒以内で同期していた。ビートがカットに落ちる。衝突音が接触フレームに乗る。スウッシュがカメラ移動に合う。

視聴者は音と映像の同期に無意識に反応する。意図があると感じる。「目的を持って作られた」と。ズレたクリップは共有が大きく落ちた。理由は説明できなくても、違和感は伝わる。

ミス：動画を作ってから別で音を足すこと。タイミングが微妙にズレる。脳は必ず気づく。

設計方法：Seedance 2.0は音と映像を同じ生成で作る。後から音を重ねないので、音の着地が自動で合う。「接触フレームで衝突音」「最初の8秒で緊張の環境音を上げる」「見せ場でビートを落とす」と書けば、統合された出力として解釈される。

パターン6：70%の見せ場報酬の瞬間、公開、変化、インパクトは、動画の65〜75%地点に置かれていた。最後でも中盤でもなく、3分の2あたりだ。

この配置は2つの効果を持つ。1つ目は、ほとんど見た視聴者を報酬で報いるため完了率が上がる。2つ目は、見せ場の後に25〜35%の余白が残り、リプレイと共有を生む最後の一撃を入れられる。

見せ場が最後の動画は共有が低い。見せ場で終わってしまい、余韻の滑走路がない。逆に見せ場が早すぎると、後半は緊張が解けて離脱する。

ミス：最終秒にクライマックスを置くこと。ドラマチックだが共有衝動を殺す。70%で報酬を渡し、最後の30%で「もう一回見たい／誰かに送りたい」を作れ。

設計方法：15秒のプロンプトなら構造を明示する。「0〜10秒で緊張を積む。10〜11秒で公開。11〜15秒で最後のビート」。時間の指示が明確なら、Seedance 2.0はそのタイミングに沿って生成する。

パターンの背後にある仕組みこの6つは創作論ではない。5,000件のデータからの構造観察だ。ジャンルに依存せず、コンテンツの種類にも依存せず、AI生成かどうかにも依存しない。

視聴者はこのパターンを知らない。でも行動は正確に従う。6つに合う動画は見られ、共有され、保存される。3つ以上外す動画はスクロールされる。

Claudeは人間が手でやれない規模で分析し、構造ルールを抽出する。そしてそのルールを各フレームに埋め込むプロンプトを書く。

HiggsfieldのSeedance 2.0がそれを実行する。音の同期を内蔵したシネマ映像、マルチショットの連続、リズムに沿うカメラ動作。

バズを祈る作り手と、バズを設計する作り手の差は、この6パターンを知っているかどうかだ。次は、作るすべてのコンテンツに組み込め。分析と文章はClaude、制作はSeedance 2.0、あとはパターンが動かす。

Key Takeaways

冒頭1.8秒は動きで掴むべき

テキストやロゴではなく、カメラの寄り・被写体の侵入・衝突など即時の運動で指を止める。静止導入は離脱を招く。

実践するなら

冒頭1.8秒に「動き」を必ず入れた絵コンテを作る

カットは平均2.3秒で一定に刻むべき

上位はリズムが一定。不規則なテンポは40〜60%弱い。2〜3秒の呼吸で全体を揃え、予測できる脈を作る。

実践するなら

全カットを2〜3秒で揃え、15秒の拍を先に決める

感情は1本につき1種類に固定すべき

好奇心・憧れ・緊張など1レーンに絞る。複数のトーン混在は最悪で、粗い映像でも感情が明確な方が伸びる。

実践するなら

各動画の感情を1語で決め、他の要素を削る

1フレーム1主役で視線を迷わせないべき

支配的要素が複数あると完了率が平均70%下がる。被写体1つ、焦点1つ、背景は従属にして着地点を作る。

実践するなら

各フレームの主役を1つに限定し、背景情報を減らす

音の着地を0.1秒以内で合わせるべき

ビートや効果音がカットや接触フレームに同期すると意図が伝わり共有が伸びる。ズレは違和感として伝わる。

実践するなら

見せ場を全体の70%地点に置き、後半30%に余韻を入れる

見せ場は全体の65〜75%に置くべき

最後ではなく約70%で報酬を渡し、残り25〜35%で余韻の一撃を作る。完了率と共有の両方を取りやすい。

背景・コンテキスト

短尺は内容の良し悪し以前に「スクロールで負けない構造」が必要になる。視聴者は判断が速く、冒頭数秒の設計が成果を大きく左右する。

分析対象は直近90日の高視聴5,000本で、ジャンルや制作手段に依存しない共通点として整理されている。再現可能な型として運用に落とし込みやすい。

制作現場では映像・編集・音を別工程にするとズレが出やすい。音と映像、時間配分、構図を最初から一体で設計する発想が重要になる。

実践するなら

▸冒頭1.8秒に「動き」を必ず入れた絵コンテを作る
▸全カットを2〜3秒で揃え、15秒の拍を先に決める
▸各動画の感情を1語で決め、他の要素を削る
▸各フレームの主役を1つに限定し、背景情報を減らす
▸見せ場を全体の70%地点に置き、後半30%に余韻を入れる

AIでバズを設計する方法

要約

Key Takeaways

冒頭1.8秒は動きで掴むべき

カットは平均2.3秒で一定に刻むべき

感情は1本につき1種類に固定すべき

1フレーム1主役で視線を迷わせないべき

音の着地を0.1秒以内で合わせるべき

見せ場は全体の65〜75%に置くべき

背景・コンテキスト

実践するなら

関連トピック