来場者がブースの前に立ち、数秒間カメラに向かうだけで――フォトリアルな3Dの「自分」が恐竜の隣に立ち、アニメヒーローの衣装をまとい、あるいはこれまでの来場者全員と一緒に無限に回転する時計の中に取り込まれる。そして、その画像をSNSに投稿する。この「自分をスキャン→自分がコンテンツになる→シェアする」という流れこそが、受け身の展示を行列のできる体験へと変えます。
本ガイドはレンダリングの技術解説ではなく、体験そのものについての実務ガイドです。パーソナルアバター・インスタレーションが実際に何をするのか、来場者が思わずスマホを取り出す具体的なシーン、費用、1時間あたりの処理人数、そして2026年時点での技術的な限界までを、正直に解説します。
この記事の対象読者: ミュージアム・展示会のプロデューサー、ブランドアクティベーション/体験型マーケティング担当者、イベント・キャンペーン責任者、そしてスキャン→3D化やAI変換体験を検討中のIP・エンタメ企業。
この記事の要点
- パーソナルアバター・インスタレーションは、カメラで来場者本人を撮影し、フォトリアルな3Dモデルを――ガウシアンスプラッティングで――生成する体験です。撮影から結果表示まで1分以内(最速で約30秒)で、任意のシーンに配置したり、動かしたり、AIで変換したりできます。
- 価値は技術ではなく「シェアされる瞬間」にあります。来場者一人ひとりがUGC(ユーザー生成コンテンツ)になり、インスタレーションがコストではなくオーガニックなリーチ装置に変わります。
- 効果が出る6つのシーンパターン:スケール比較(クジラの隣に立つ)、ありえない配置(屋上や宇宙に自分を置く)、集合的ジェネラティブアート(全来場者を1つの作品に取り込む)、記念の3Dお持ち帰り、IP挿入(ヒーローの衣装を着る)、テーマ別AI変換。
- 現実的な処理能力は、アニメーション再生も含めて1ブースあたり1時間60人未満。GPU1台で2ブースを並列駆動できます(一方が再生中に他方が生成)。
- 正直な限界:2026年時点の品質は全身・シーンスケールの配置には十分ですが、顔のクローズアップにはまだ非対応です。この技術は品質より速度を優先しており、品質は急速に向上しています。
- 費用はインタラクティブ・インスタレーションの予算帯に位置します。1ブースのアクティベーションで約300万〜600万円($20K〜$40K)、カスタムのマルチシーン/AI変換で600万〜1,200万円($40K〜$80K)、フラッグシップ/マルチブースで1,500万円〜($100K〜)が目安です。
1. パーソナルアバター・インスタレーションとは
最もシンプルに言えば、カメラと画面、そして人を「瞬時」と感じる速さで3Dアセットに変えるパイプラインです。

1-1. 撮影→3D→シーンの流れ
- 撮影。 来場者がカメラの前に立ちます。多くのシーンは正面写真だけで十分です。背面の撮影は、シーンで人物の背中を3Dで見せる必要がある場合(来場者がカメラに背を向ける、または全周回転する演出)にのみ追加します。
- 生成。 システムが本人をガウシアンスプラット――フォトリアルな3D表現――として再構築します(フォーマットの仕組みはガウシアンスプラッティング完全ガイドを参照)。これが、キャラクターではなく「本人そっくり」の見た目を生み出します。
- 配置・変換。 生成された3Dモデルを用意したシーンに配置し、ボーンを入れて動かせるようにするか、AIで衣装やキャラクター、スタイルに変換します。
- 表示・シェア。 結果を大画面で再生し、来場者が持ち帰れる動画や画像として書き出します――そして投稿されます。
1-2. なぜゲームアバターではなくガウシアンスプラッティングなのか
多くの「自分をスキャン」体験は、カクカクしたメッシュやデフォルメされたアバターを生成します。ガウシアンスプラッティングは本人の実際の光と質感を捉えるため、出力はフォトリアル――紛れもなく本人です。この「本人だと認識できること」こそが、感情的なインパクトの核心です。人はフォトリアルな3Dの「自分」を、汎用アバターでは決してしない形でシェアします。スプラッティングとフォトグラメトリ・NeRF・LiDARの比較は3Dキャプチャ手法の選び方を参照してください。
2. 「1分以内」が重要な理由(速度の数字)
行列型の公開インスタレーションでは、生成時間そのものが設計上の制約になります。生成が十分に速いため、来場者を撮影した瞬間に短いつなぎのアニメーション――ローディング演出、ティーザー、これから本人が現れる場所にシーンが組み上がっていく映像など――を再生でき、待ち時間が体験の中に吸収されます。「お待ちください」ではなく、全体がシームレスに感じられます。以下は当社のR&D環境(クラウドのRTXクラスGPU:RunPod RTX 5090)での実測値です。
| ステップ | 所要時間 | 備考 |
|---|---|---|
| ガウシアンモデル(正面写真のみ) | 約22秒 | 最速。多くのシーン配置に十分 |
| ガウシアンモデル(正面+背面) | 約37秒 | より完全なモデル。シーンで背中を見せる場合のみ |
| リグ(動かすためのボーン付与) | 約4秒 | ローカルで実行。静止ポーズだけなら省略可 |
つまり撮影→3D→リグの一連の処理は30秒以内に収められます。静止配置(クジラの隣に立つなど)だけなら、リグを省いてさらに速く表示できます。
処理能力: 来場者がアニメーションを見る時間も含めて、現実的な処理能力は1ブースあたり1時間60人未満です。GPU1台で2ブースを同時駆動でき(ブースAが再生中に、ブースBはすでに次の来場者を生成)、1台で実効処理能力がおよそ2倍になります。
3. シーンのメニュー――人がシェアしたくなる仕掛け
ここが、インスタレーションが単なる話題づくりで終わるか、行列を呼ぶかを分ける部分です。技術は同じでも、シーンこそが商品です。来場者が思わずスマホを取り出す、実証済みの6パターンを挙げます。
3-1. スケール比較
来場者の3Dの「自分」を、現実では隣に立てないものの隣に配置します――等身大のクジラ、ティラノサウルス、ロケット、シロナガスクジラの心臓など。自然史・科学博物館は物理的なスケールで学びを伝えますが、これは来場者自身を比較の一部にします。「私は恐竜の膝の高さだ」は、瞬時にシェアされる教育的な画像になります。
3-2. ありえない配置
物理的に行けない場所に来場者を置きます:パノラマの決めショットのための建物の屋上、宇宙空間、水中、ステージの上など。魅力は「ありえなさ」――存在しえない写真の主役が自分、という点です。
3-3. 集合的ジェネラティブアート
一人ずつではなく、スキャンした来場者全員を1つの進化し続ける作品に取り込みます――その日の来場者で構成される無限の時計、ゆっくり回転する群衆、人が増えるほど成長する群れなど。「自分を探す」というリピート鑑賞を促し、取引的ではなく「生きている」インスタレーションに感じさせます。パーティクル――文字・タイポグラフィのパーティクルを含む――を混ぜて、群衆が崩れて言葉や形に再構成される演出も可能です。これは、万博2025大阪に出展した『Waves of Connection』――約100万個のパーティクルが来場者の動きにリアルタイムで反応する作品――と同じリアルタイムパーティクル技術です。
3-4. 記念の3Dお持ち帰り
来場者が3Dの「自分」を持ち帰ります――ダウンロード動画、AR表示、あるいはプリント。派手さは控えめですが、記憶への残りやすさと持ち帰り価値が高く、他のどのパターンにも追加できます。
3-5. IP挿入(マンガ・アニメの活用)
エンタメ・出版ブランド向け:来場者を撮影し、AIがキャラクターの衣装に変換してキャストと並ぶ3Dシーンに配置する――あるいはモンスターと戦うアニメーションに登場させます。ワンピース風のコスプレ変換でヒーローたちと肩を並べる、といった体験は、ファンが即座に投稿し、公式をタグ付けする類のものです。ライセンスIPのアクティベーション、アニメ・ゲームのローンチ、ファンイベントに最も適したパターンです。

3-6. テーマ別AI変換
特定IPを使わない同じAIステップです:来場者をサイバーパンク、歴史、ファンタジー、季節バージョンの自分に変換します。変換そのものがメッセージになる映画プロモーション、リテールキャンペーン、季節のブランド施策に適しています。
AIステップとスキャンの関係: ガウシアンキャプチャがフォトリアルな3Dの「自分」を作り、AI変換はその上に(あるいは生スキャンの代わりに)重ねる別レイヤーです。コアのパイプラインは同じで、変換は別の機械ではなく「もう一つのユースケース」です。
4. なぜシェアされるのか――コンテンツのループ
パーソナルアバター・インスタレーションが予算に見合う理由は、来場者自身がマーケティングを生産する点にあります。
- スキャン1件がシェア1件。 フォトリアルな3Dの「自分」は本質的に投稿されます。投稿する来場者一人ひとりが、自分のフォロワーに向けて、あなたのブランドや展示を画面に入れて発信します――支払っていないオーガニックリーチです。
- 出力がSNSネイティブ。 短い3Dクリップ(オービット、アニメーション、変換)は、まさにInstagramリール、TikTok、Xで伸びるフォーマットです。
- イベントで効果が積み上がる。 ローンチやファンイベントでのブランド化・タグ付け可能な変換は、来場者を、その後数日にわたる分散型キャンペーンに変えます。
これは、あらゆる高シェア型インスタレーションの背後にある体験経済のロジックと同じです。人は自分が一部になった体験に注目し、シェアします。戦略的な背景は体験経済入門とデジタル体験 vs フィジカル体験を参照してください。
5. 2026年時点での正直な限界
制約は、クライアントがぶつかる前に明示することで信頼が生まれます。
- 顔のクローズアップにはまだ非対応。 2026年の品質は、自然な距離で見る全身・シーンスケールの配置には十分ですが、顔のタイトなクローズアップにはまだ非対応です。目のマクロショットに依存する企画なら、今はこのツールの出番ではありません。これは意図的なトレードオフで、公開の行列で回せるようパイプラインが品質より速度を優先しています。品質の上限は急速に上がっています。
- 撮影条件が効く。 ブースでの安定した照明とクリーンな背景が、結果を大きく改善します。廊下でスマホ、ではなく、設計された撮影環境です。
- 正面のみ vs 正面+背面。 正面のみは速いですが背面が不完全になります――シーンで背中が映らないなら問題なく、映るなら+約15秒の価値があります。
- スキャンサービスではなく体験。 目的は、アーカイブ用の寸法正確な3Dスキャンではなく、速さのある心地よいシェア体験です。
6. プライバシーと同意
人の顔と身体を撮影します。初日から個人情報として扱ってください。
- セッション後に削除。 推奨される既定の姿勢:スキャンは各セッション後に削除します――来場者はクリップを受け取り、個人データは保持しません。個人情報保護法への適合と、ブース現場での信頼獲得の、最もシンプルな方法です。
- 明示的な事前同意。 撮影前に、何を撮影し、何に使い、削除することを明確に告知してオプトインを取得します。
- 地域ルールの適用。 日本国内は個人情報保護法、EU向けイベントはGDPR、米国向けは州の生体情報・プライバシー規制(顔・身体データについてはイリノイ州BIPAなど)が関わります。同意フローと保持ポリシーは、当日の対応ではなく発注要件書に組み込んでください。
7. 費用:パーソナルアバター・インスタレーションの予算帯
費用はインタラクティブ・インスタレーションの予算帯に位置します。変数は、ブース数、AI変換レイヤーの要否、シーンのカスタム度、稼働期間です。
| 規模 | 費用帯 | 内容 |
|---|---|---|
| 1ブースのアクティベーション | 300万〜600万円($20K〜$40K) | 撮影ブース1台、用意されたシーン1〜2、静止または軽いアニメーション配置、画面再生+シェア書き出し、イベント期間の稼働。 |
| カスタム・マルチシーン/AI変換 | 600万〜1,200万円($40K〜$80K) | 専用シーン、リグ/アニメーション、AI変換レイヤー(IPまたはテーマ)、ブランド化出力、解析、長期稼働・巡回。 |
| フラッグシップ/マルチブース/常設 | 1,500万円〜($100K〜) | 複数ブース、集合的ジェネラティブアート、カスタムハードウェア、常駐の現場対応、継続的なコンテンツ更新。 |
費用を左右する要素:
- AI変換レイヤー(IPコスプレ、テーマ別変換)は、基本の撮影ブースに加えてクリエイティブ・ライセンス・パイプラインの工数が乗ります。
- 計算資源。 生成はGPUで実行します(当社のR&DはRunPod RTX 5090クラス、GPU1台あたり時間約$1)。GPU1台で2ブースを賄えます。短期――ポップアップストア、2日間のアクティベーション、週末イベントなど――にはクラウドGPUが適しています。使った時間だけ支払え、機材を運ぶ必要もありません。一方、長期・常設のインスタレーションには、同等のGPUを積んだデスクトップタワーの購入を推奨します。数週間を超える連続稼働では、所有機材の方が従量課金のクラウドより安く、現地での通信やクラウドアカウント稼働への依存もなくなります。いずれにせよ、計算資源は構築費ではなく運用・セットアップ費で、構築費に対しては控えめです。
- シーンとリグ。 カスタムシーンとキャラクターアニメーションはクリエイティブ工数です。作り込んだ1シーンは、雑な複数シーンより効果があります。
- Web版。 来場者が自宅でスキャンする/キャンペーンサイトで体験する形は、プレミアムWebサイトの予算帯に乗ります――リアルタイム3DのWeb構築で、規模により300万〜1,500万円〜($20K〜$100K〜)。
- 保守/イベント支援: 常設なら構築費の年10〜15%を目安に。短期アクティベーションなら稼働期間の現場技術支援を見込みます。
前提:
- 会場・イベント種別:[ミュージアム/ブランドアクティベーション/ファンイベント/リテール/ローンチ]
- 主目的:[SNSリーチ/滞在時間/教育/IPエンゲージメント/集客]
- AI変換(IP衣装/テーマ別変換)は必要か:[要否+対象IP]
- 想定来場者数と1日の稼働時間:[記入]
- おおよその予算帯:[記入]
手伝ってほしいこと:
- 目的に合うシーンパターン(スケール比較/ありえない配置/集合アート/お持ち帰り/IP挿入/テーマ別変換)の選定
- 処理能力(1ブース1時間60人未満)を踏まえた必要ブース数の概算
- 制作会社が正確に見積もるために必要な質問リスト(プライバシー・同意・保持ポリシーを含む)
8. 導入しない方がよい場合
- 顔のクローズアップが必要。 企画がマクロな顔の描写で成立する/破綻するなら、2026年の品質では届きません――待つか、別手法を。
- 来場者数が少ない。 ROIはシェアのループです。来場者が少なければコンテンツもリーチも生まれません。人の来ない一角はブースを正当化しません。
- シェアの動機・ハッシュタグ設計がない。 投稿を促す仕掛け(ブランド化出力、簡単な書き出し、タグ付けの理由)がなければ、リーチ装置ではなく「おもちゃ」を作ったことになります。
- フォトスポットで十分。 ブランド背景とスマホだけで成果の8割が取れるなら、作り込みすぎです。
9. 進め方
- まずシーンパターンを選ぶ(3章)――目的がシーンを決め、シーンが構築を決めます。
- AIレイヤーの要否を決める。 IPコスプレやテーマ別変換は、独立したクリエイティブ+ライセンスの工程です。
- 来場者数からブース数を算定。 1ブース1時間60人未満を目安に。GPU1台で2ブース。
- プライバシー・同意+セッション後削除のポリシーを発注要件書に明記(当日チェックリストではなく)。
- シェアのループを設計。 ブランド化出力、ワンタップ書き出し、タグ付けの理由。
- リアルタイム3Dとガウシアンスプラッティングを扱う制作会社に依頼(汎用のフォトブース業者ではなく)。
10. Utsuboについて
Utsuboは、リアルタイム3D、ガウシアンスプラッティング、インタラクティブ・インスタレーションを専門とする大阪拠点のクリエイティブ・テクノロジースタジオです。自社のガウシアンスプラット・パイプラインを開発しており――正面写真からフォトリアルな3Dの人物を約22秒で生成し、数秒でリグを入れる高速ヒューマンキャプチャのR&D設定を含みます――さらに、キャプチャしたスプラットと標準的なThree.jsオブジェクトを混在させ、リライティング、ダイナミックシャドウ、物理演算に対応した独自のスプラットレンダラーも備えています。この撮影→シーンのパイプラインが、パーソナルアバター・インスタレーションを「もたつき」ではなく「瞬時」に感じさせます。
この種の体験に必要なスタック全体――現地インスタレーションとWeb上のリアルタイム3D――に対応し、規模のある実績もあります。2025年大阪・関西万博に出展した『Waves of Connection』では、北斎《神奈川沖浪裏》を約100万個のリアルタイムパーティクルで再解釈し、来場者の身体の動きで波を操作できる体験を制作しました。さらに日本最大級の鉄道グループであるJR向けの制作をはじめ、文化・ブランド領域のクライアントと協業してきました。
11. ご相談ください
来場者が自分を3Dにスキャンするインスタレーション――ミュージアム、ブランドアクティベーション、IP・ファンイベント向け――を計画中ですか?私たちはインタラクティブ体験、ガウシアンスプラッティング、リアルタイム3Dでチームと協業しています。
パートナーシップをご検討中なら、プロジェクトについてお話しましょう:
- 何を構築しているか、どのような制約があるか
- 目標に対してどの技術アプローチが適切か
- 私たちが実行をお手伝いするのに適したパートナーかどうか
12. チェックリスト
- シーンパターンを選定(スケール比較/ありえない配置/集合アート/お持ち帰り/IP挿入/テーマ別変換)
- AI変換レイヤーの要否を決定(該当する場合はIPライセンスをクリア)
- 来場者数からブース数を算定(1ブース1時間60人未満/GPU1台=2ブース)
- 撮影環境を計画(照明、背景、正面のみ/正面+背面)
- プライバシー・同意フロー+セッション後削除ポリシーを発注要件書に明記
- シェアのループを設計(ブランド化出力、簡単な書き出し、タグ付けの動機)
- クローズアップの限界をクリエイティブ企画と照合
- ブース数・シーン・稼働期間に予算帯を対応
- ガウシアンスプラッティング+リアルタイム3Dの制作会社を選定(汎用フォトブースではなく)
よくある質問
来場者を3Dにスキャンするのにどれくらいかかりますか?
フォトリアルなガウシアンモデルは正面写真から約22秒、正面+背面で約37秒です。動かすためのボーン付与にさらに数秒。撮影からリグまでの一連は約30秒に収められ、静止配置ならさらに速く表示できます。十分に速いため、生成中は短いつなぎのアニメーションを流せ、待ち時間がシームレスに感じられます。
1時間に何人処理できますか?
来場者がアニメーションを見る時間も含めて、現実的には1ブースあたり1時間60人未満です。GPU1台で2ブースを並列駆動でき――一方が生成、他方が再生――1台で実効処理能力がおよそ2倍になります。
3Dモデルはクローズアップに耐えますか?
2026年時点ではまだです。自然な距離で見る全身・シーンスケールの配置には十分ですが、顔のタイトなクローズアップにはまだ非対応です。ライブの行列で回せるよう、パイプラインが意図的に品質より速度を優先しています――品質の上限は急速に上がっています。
来場者のスキャンはどうなりますか。保存されますか?
推奨される既定は、各セッション後に削除することです:来場者はクリップを受け取り、個人データは保持しません。明確な事前同意と組み合わせることで、体験は適法に保たれ(日本の個人情報保護法、EUのGDPR、米国の生体情報規制であるBIPAなど)、ブース現場での信頼につながります。
来場者を特定のキャラクターやIPに変換できますか?
はい。フォトリアルなキャプチャの後、AIレイヤーが来場者をキャラクターの衣装に変換し、キャストと並ぶ3Dシーンに配置したり――モンスターと戦うアニメーションに登場させたりできます。アニメ・マンガ、ゲーム、映画のアクティベーションに最も適します。変換にはIPのライセンスが必要です。
パーソナルアバター・インスタレーションの費用は?
インタラクティブ・インスタレーションの予算帯に位置します:1ブースのアクティベーションで約300万〜600万円($20K〜$40K)、カスタムのマルチシーン/AI変換で600万〜1,200万円($40K〜$80K)、フラッグシップ/マルチブース常設で1,500万円〜($100K〜)。クラウドGPUの計算資源(GPU1台あたり時間約$1、GPU1台で2ブース)は運用費として加算されます。
物理ブースではなくWebサイトとして運用できますか?
はい――同じコアのパイプラインで、来場者が自宅でスキャンする、あるいはキャンペーンサイトで体験するWeb版を動かせます。その形はインスタレーションではなくプレミアムWebサイトの予算帯(リアルタイム3DのWeb構築)に乗ります。プレミアムWebサイトの費用ガイドを参照してください。

大阪のインタラクティブインスタレーションスタジオ


