インタラクティブ点群:リアルタイム・ガウシアンスプラッティングと点群アートを使ったライブインスタレーション(2026年版)

ルカム・ジョスラン

ルカム・ジョスラン

代表取締役、Utsubo株式会社

2026年6月5日·22分で読めます
インタラクティブ点群:リアルタイム・ガウシアンスプラッティングと点群アートを使ったライブインスタレーション(2026年版)

Web上でぐるぐる回せる点群は「完成した作品」です。一方、ライブインスタレーションの中の点群は演者です。リアルタイムでレンダリングし、目の前の来場者に反応し、ギャラリーの床で一日8時間動き続けなければなりません。

本ガイドが扱うのは、後者です。つまり、点群やガウシアンスプラットを物理空間でライブかつインタラクティブに使う方法です。事前にベイクしたWebフライスルーではなく、デプスカメラ・モーション・音声によって駆動され、プロジェクションマッピングやLEDで出力されるリアルタイムレンダリングです。これは「3Dキャプチャ」と「インタラクティブインスタレーション」という2つの領域が交わる地点であり、その制約はWeb埋め込みとはまったく異なります。

ガウシアンスプラッティングとは何か、シーンをどう撮影するか、静的なWebビューワーをどう発注するか——その基礎はガウシアンスプラッティング完全ガイドで解説しています。本記事はその前提のうえで、ライブ=現場での構築に直接踏み込みます。

対象読者: クリエイティブディレクター、博物館・美術館の展示企画担当者、体験型・イベント系の制作会社、そしてライブインスタレーション(ギャラリー、博物館、ブランド体験、ステージ、プロジェクション空間)に点群・3DGSの採用を検討しているテクニカルアーティスト。


要点まとめ

  • ライブ ≠ Web。 静的なスプラットビューワーはベイク済みシーンをブラウザに配信します。ライブインスタレーションは現場の専用ハードウェア上で、リアルタイムに、空間に反応しながら点群をレンダリングします——まったく別のエンジニアリング課題です。
  • インタラクティブ性はセンサーから生まれる。 デプスカメラ(Azure Kinect / Orbbec クラス)、LiDAR、モーショントラッキング、音声解析が、点群の動き・出現・変形を駆動します。
  • 出力は物理的。 プロジェクションマッピング、LEDウォール/ボリューム、大型ディスプレイ——それぞれに固有の輝度・解像度・キャリブレーション要件があります。
  • ファイルではなくフレームを設計する。 現場では点群/スプラット数と、60 FPS(LEDではそれ以上)という厳格なフレーム予算とのトレードオフになります。ダウンロードサイズより、LODとカリングが重要です。
  • 2つのソース経路。 事前撮影スプラット(映像的・制御しやすい)か、現場のデプスセンサーによるライブ撮影点群(来場者そのものがコンテンツになる)か。多くのインスタレーションは両方を併用します。
  • 費用感: センサー1台・面1つに絞ったプロジェクション作品で $25K〜$60K、複数センサー・複数面のシグネチャー作品で $80K〜$250K+(ハードウェア・会場費は別途)。
  • ツール: ライブ点群はTouchDesignerとNotchが主流。重いリアルタイムシーンはUnreal/Unity。WebGPUの進化により、キオスク規模ならブラウザでのリアルタイムスプラッティングも現実的に。

1. 「インタラクティブ/リアルタイム点群」とは何か

点群とは、空間内の点の集合で、各点が位置と色を持ちます。ガウシアンスプラットはその発展形で、各点が向きを持つ柔らかい色と不透明度の「塊」を担います。スプラットがフォトリアルに見え、生の点群が疎に見えるのはこのためです。(定義と撮影ワークフローの詳細はガウシアンスプラッティング完全ガイドを参照してください。ここでは繰り返しません。)

本記事ですべてを変える言葉はライブです。点群が体験に登場する形は3通りあり、私たちが構築するのは最後の1つだけです。

モード内容動作場所来場者に反応?
ベイク済みWebビューワー事前撮影シーンをブラウザに配信し、回転・フライスルー来場者のデバイスしない——固定シーン、カメラ操作のみ
リアルタイム再生事前撮影点群を現場でライブにレンダリング、アニメーションも可現場のGPU間接的(タイムライン、トリガー)
インタラクティブ/センサー駆動形・動き・出現がライブ入力で駆動される点群現場のGPUする——直接、リアルタイムに

「アートインスタレーションのプロジェクションマッピング用にインタラクティブな点群を作る」と検索する人が求めているのは、一番下の行です。点群は「見るもの」ではなく、「反応するもの」なのです。


2. リアルタイム vs ベイク:核心のトレードオフ

これがプロジェクト全体を決める判断です。

ベイク(Web/動画)リアルタイム(ライブインスタレーション)
レンダリング事前計算または配信、予測可能毎フレーム現場で描画、フレーム予算を死守
インタラクティブ性なし〜カメラ操作のみ完全——センサー入力で毎フレーム形状が変化
品質の上限非常に高い(オフラインで時間を使える)現場GPUとフレーム予算に制約される
失敗の形読み込みが遅いフレーム落ち、遅延、センサー断——観客に見える
コンテンツ撮影時に固定ライブの来場者を取り込める
適する用途マーケティング、記録、リモートツアーギャラリー、ステージ、体験施策、博物館の参加型展示

正直なトレードオフは、ベイクは品質を、リアルタイムは反応を買うということです。スプラットシーンをUnrealでベイクすれば、同じシーンをライブ描画したものより常に美しくなります。しかし、それは「あなたが近づいたから」溶けることは決してできません。ブリーフに「反応する」「リアクトする」「来場者が」という言葉があれば、それはリアルタイム領域であり、他のすべての判断はフレーム予算から導かれます。


3. インタラクティブ性の仕組み:点群を駆動する

インタラクティブ性とは、センサーが信号を生み、その信号が点群のパラメータ——位置、色、サイズ、不透明度、発光、あるいはそもそもどの点を表示するか——を駆動することです。主な入力レイヤー:

入力ハードウェア(2026)得意なこと注意点
デプス/スケルトンAzure Kinect(生産終了——在庫/中古)、Orbbec Femto、Intel RealSense身体位置、ジェスチャー、在席検知、来場者のライブ点群撮影Kinect生産終了——センサー調達計画を。複数台間のIR干渉
LiDAR / ToF2D安全LiDAR、固体ToF広域の在席、床ゾーン、群衆密度2Dは姿勢でなく位置のみ。投影空間へのキャリブレーション
カメラ / CVRGB+オンデバイスML(姿勢、オプティカルフロー、セグメンテーション)マーカーレス追跡、シルエット抽出、手の追跡照明依存。推論による遅延
モーション / IMUスマホ、ウェアラブル、トラッキング小道具制御された動線での来場者ごとの信号オンボーディングの手間。バッテリー・運用
音声マイク/ライン入力+FFT音声リアクティブな変形、ビート同期の出現——安価で堅牢群衆の雑音。音楽作品ではクリーンなソースが必要

センサー駆動アートで主流のパターンは、デプスカメラがリアルタイムエンジンに入力する構成で、来場者の身体が点群に作用する力場になります——点を押しのけ、隠れた構造を露わにし、あるいは自分自身のデプス撮影がライブにスプラットされて点群そのものになるのです。RGB-Dデプスセンシングと動的プロジェクションマッピングを組み合わせるリアルタイムパイプラインは確立されています。腕の見せ所はセンシングではなく、信号から動きへの「マッピング」にあります。

遅延がすべてです。 16 ms(1フレーム)の遅れは「生きている」と感じられますが、80〜100 msは「壊れている」と感じます。センサー読み取り・処理・描画を配分し、モーション・トゥ・フォトン(動作から発光まで)を約50 ms以下に保ってください。


4. 出力:点群を物理的な面に届ける

ライブ点群は、部屋のどこかに着地しなければなりません。主力となる3つ:

出力強み制約典型的な用途
プロジェクションマッピング建築規模に拡張可能、既存の面を変容、㎡単価が比較的安い環境光との輝度勝負、やや暗い空間が必要、面のキャリブレーション、来場者の影壁、床、オブジェ、大空間
LEDウォール/ボリューム明るく鮮明、明るい空間でも動作、点・粒子表現の高コントラスト㎡単価が高い、ピクセルピッチで細部に限界、重量・吊り込みロビー、ステージ、リテール、昼光のある会場
大型ディスプレイ設置が簡単、安定、キャリブレーション不要サイズに上限、複数パネルではベゼルキオスク、単画面の参加型展示

点群とスプラットは、プロジェクションとLEDと相性が抜群です。疎で発光する点の場は黒背景に美しく映え、加算的で粒子的な見た目は、テクスチャ動画につきもののシームや減衰を隠してくれます。特にプロジェクションでは、インタラクティブ性を駆動するのと同じデプスセンサーをリアルタイムの面キャリブレーションにも使え、シーンや形状が変化してもマッピングを合わせ続けられます。

プロジェクションマッピングが初めての方は、インスタレーション vs プロジェクションマッピングの比較で各出力媒体の使い分けを解説しています。


5. ツールとパイプライン

「点群インスタレーション」という単一のアプリはありません。リアルタイムエンジン、点群/スプラット対応、センサーI/O、出力/キャリブレーションを組み合わせてパイプラインを構築します。現在の主要ツール:

ツール役割点群/スプラット対応適する用途
TouchDesignerノードベースのリアルタイムエンジン、インスタレーションの定番ネイティブの点群TOP/POP、ガウシアンスプラット描画も対応センサー駆動、プロジェクション、音声リアクティブ作品
Notchリアルタイムモーション/VFX、ライブイベントに強いパーティクル&点群システム、メディアサーバー連携ステージ、放送、大型LEDショー
Unreal Engine重量級リアルタイムレンダラー3DGSプラグイン(XScene等)、Niagaraパーティクル映像的リアルタイム、複雑なシーン、XR
Unityリアルタイムエンジンスプラットパッケージ、VFX Graphの点群カスタム参加型アプリ、マルチプラットフォーム
WebGPU(カスタム)ブラウザ級のリアルタイムスプラッティングリアルタイム3DGSレンダラー——下記参照キオスク、Web配信参加型、軽量な現場用
openFrameworks / Processingクリエイティブコーディング基盤デプスSDK経由の生点群作り込み、低レベル制御、研究的な作品

WebGPUについて: ブラウザでのリアルタイムスプラッティングは2025年に実用ラインを越えました。web-splat はRTX 3090で200 FPS超(8年前のGPUでも約130 FPS)を報告し、新しいWebGPUエンジンは数百万ガウシアンで約2〜16 ms/フレーム——WebGL世代の60〜135倍を達成しています。これにより、ブラウザはリモートビューワーにとどまらず、キオスク規模の参加型展示の現場ランタイムとしても十分通用します。ただし、複数のデプスカメラで駆動するシグネチャー級のプロジェクション作品では、TouchDesignerやNotchが現実的な選択です。

Three.js/WebGPUの詳細なパフォーマンス手法はThree.jsベストプラクティスを参照してください。


6. 現場のパフォーマンスと技術的制約

ライブインスタレーションが成否を分けるのはここです。Webビューワーならスマホで30 FPSに落ちても誰も気づきません。しかし、観客の前で投影作品がカクつけば、それは公開の場での失敗です。

フレーム予算が制約です。 60 FPSなら、1フレームに16.6 msしかありません。そこにセンサー読み取り、信号処理、シミュレーション、ソート、描画、出力のすべてを収めます。スプラットはカメラや形状が動くたびに毎フレーム深度ソートが必要で、このソートがボトルネックになりがちです。だからこそ現場ではGPUコンピュート(WebGPU/エンジンのコンピュートシェーダー)が効いてきます。

単一の現場GPU(RTX 4070/4080クラス)でのおおよその設計値:

シーン規模点/スプラット数現実的な目標備考
親密/単一面〜約100万60 FPS余裕あり重いインタラクティブ性の余地あり
標準インスタレーション100万〜400万LOD+カリングで60 FPS多くの投影作品
大規模/高解像度LED400万〜800万60 FPSには調整、デュアルGPUもソート+フィルレート律速
複数面/複数出力800万以上複数マシン/メディアサーバーに分割同期が難所になる

予算超過時のレバー: 点数を減らす(ダウンサンプル)、積極的なフラスタム/不透明度カリング、LOD階層、投影・描画解像度を下げる、点ごとのシェーダーを簡素化、複数マシンに分散。やってはいけないことは、生の1000万スプラット撮影をそのままライブショーに出すこと——Web最適化と同じ教訓ですが、賭け金が高くなります。

その他の現場の現実:出力ごとに専用マシンが最も安全、8時間稼働の熱設計、ウォッチドッグ/自動再起動、そして作品が固まったフレームやエラーを決して見せないためのアイドル/アトラクトループセンサー断フォールバックを必ず用意すること。


7. ライブ撮影 vs 事前撮影スプラット

点はどこから来るのか。多くは併用されますが、2つの思想があります:

事前撮影スプラットライブ撮影点群
ソース場所や物の3DGS撮影を事前に実施現場のデプスカメラが部屋/来場者をリアルタイム撮影
見た目フォトリアル、アートディレクション可、安定より生っぽく疎、フレームごとの忠実度は低め
来場者シーンに作用する(力、出現)シーンになる(自分の点群が描画される)
リスク撮影品質が事前に固定センサーノイズ、照明、ライブのキャリブレーション
感覚入っていく世界溶けていく鏡

最も印象的な作品は両者を融合します。事前撮影でアートディレクションされたスプラット環境を、来場者のライブデプス撮影が乱し、混ざり、露わにする——事前撮影は制御と美しさを、ライブ撮影は「これ、私だ」という不思議な瞬間を与え、それが人を引き留めます。


8. 費用と工数

ライブインスタレーションは、コンテンツの分数ではなく複雑さ——センサー数、出力面数、作り込んだインタラクション設計、現場での調整——で価格が決まります。2026年の目安(クリエイティブ/エンジニアリングのスコープ。ハードウェアと会場費は別途):

ティアスコープ目安(USD)期間
フォーカス型センサー1台、面1つ、明確なインタラクション1つ$25K〜$60K6〜10週
シグネチャー型複数センサー、プロジェクションまたはLED、作り込んだインタラクションとコンテンツ$80K〜$250K12〜20週
フラッグシップ型複数室・複数面、ライブ+事前撮影の融合、カスタムハードウェア$250K+20週以上

別途見積もるハードウェア: プロジェクターまたはLED(多くの場合これが最大の費目)、現場GPU/マシン、デプスセンサー、マウント/吊り込み、予備機。忘れてはいけない現場調整: 現場でのキャリブレーション、実際の部屋でのインタラクション調整、そして「スタジオでは動く」と「現場で動く」の差を埋めるための予備費——通常は工数の15〜25%で、ほぼ確実に過小評価されます。

インスタレーションが投資をどう回収するかは、インタラクティブインスタレーションの収益モデルを参照してください。


9. 実際のインスタレーション事例

ライブ点群の美学と、各作品が示すものの参照点をいくつか:

  • 池田亮司 — データ・点群駆動の視聴覚インスタレーションの基準点。data-versethe transfinite といった作品は、膨大なデータセットを音に同期した没入的な点/粒子の場へと変換し、巨大な投影面に展開します——「素材としての点」の規範的言語です。
  • デプスカメラによる身体作品 — デプスセンサーがパフォーマーや来場者を捉え、ライブ点群として(しばしばプロジェクションマッピングで)描画する系譜(openFrameworks/Kinectの実験以降)。RGB-D撮影 → リアルタイム点群 → 投影という技術パターンは、アートと研究の両方で十分に文書化されています。
  • TouchDesignerのスプラット実験 — ガウシアンスプラットをTouchDesignerの点演算子に持ち込んだコミュニティの2025年の取り組み(こちらに記録)は、撮影済みスプラットシーンをセンサー入力と並んでリアルタイムに操作・描画する、いまや標準的なライブパイプラインを示しています。

これらはテンプレートではなく語彙として使ってください——成功する作品は、その空間と観客に固有のインタラクションを持つものです。


10. よくある失敗

  • Webビューワーと同じ扱いをする。 Web最適化の習慣は役立ちますが、現場は厳格なフレーム予算と物理出力を伴うリアルタイム描画の問題です。ダウンロードサイズではなく、それを前提に計画を。
  • フォールバック状態がない。 センサーは断線し、マシンは不調になります。アトラクトループとセンサー断フォールバックがなければ、観客は固まったフレームかエラーを見ます。最後ではなく最初に作りましょう。
  • 現場調整の過小評価。 実際の部屋では必ず挙動が変わります——環境光、面、群衆の影、IR干渉。現場日数と予備費を確保すること。
  • 遅延の蓄積。 各レイヤー(センサー → 処理 → 描画 → 出力)がミリ秒を積み増します。モーション・トゥ・フォトンを早期に計測しましょう。遅れるインタラクションはインタラクティブに感じられません。
  • 点群の過剰なスコープ。 フレーム落ちする1000万スプラットのシーンより、60 FPSを保つ200万スプラットのシーンの方が優れています。部屋は細部より先に滑らかさを読み取ります。
  • 単一障害点。 すべてを1台のマシンで駆動し、予備もウォッチドッグもない——デモでは問題なくても、1か月の展示では負債です。

11. なぜUtsuboか

本記事は、Utsuboが手がける2つのこと——ガウシアンスプラッティングインタラクティブインスタレーション——の交点にぴたりと位置します。これは思いのほか稀なことです。多くのスプラット系の会社はWebビューワーを作り、多くのインスタレーションスタジオは点群に触れません。私たちは両方をやります。だからこそ、撮影済みのスプラットシーンを物理空間で反応させることができます。

私たちは大阪を拠点とする、海外出身者が率いるクリエイティブスタジオで、リアルタイム・インタラクティブな仕事で FWA 12回Awwwards 7回の評価を受けています。Expo 2025大阪での北斎インタラクティブインスタレーションは、本ガイドのパターンを体現するライブな実例です——来場者が身体で動きを操る粒子の場を、万博の会場で展示しました。

ライブ点群作品を検討されているなら、リアルタイム vs ベイクの判断、センサーと出力スタックの選定、そして公開の場で生き残る作品づくりをお手伝いできます。


インタラクティブ点群インスタレーションをはじめる

空間とブリーフがすでにある場合も、「点群が自分のアイデアにふさわしい素材かもしれない」という感覚だけの場合も、喜んでご相談に乗ります。

30分のプロジェクション相談を予約して、コンセプト・インタラクション・技術アプローチを検証し、私たちが適切なパートナーかどうかを確かめてください。


よくある質問

インタラクティブ点群インスタレーションとガウシアンスプラッティングのWebビューワーは何が違いますか? Webビューワーは事前撮影したベイク済みシーンをブラウザに配信し、唯一のインタラクションはカメラの移動です。インタラクティブインスタレーションは現場の専用ハードウェア上でリアルタイムに点群をレンダリングし、センサーに応じて点群そのものを変化させます——来場者の物理的な行動が、見えるものを実際に変えます。

インタラクティブ性を駆動するハードウェアは何ですか? 最も一般的なのは、身体やジェスチャー用のデプスカメラ(Orbbec、Intel RealSense、または生産終了したAzure Kinect)です。加えて、広域の在席検知にLiDAR、マーカーレス追跡にオンデバイスMLを備えたRGBカメラ、音声リアクティブ作品に音声入力を使います。センサーが生む信号が、点群のパラメータを駆動します。

ガウシアンスプラットをライブで使えますか、それとも静的な点群だけですか? はい、スプラットはライブで動かせます。TouchDesigner、Notch、Unreal、Unityといったエンジンはいまやガウシアンスプラットをリアルタイムに描画でき、WebGPUによりブラウザでのリアルタイムスプラッティングも現実的です。制約はスプラット形式そのものではなく、毎フレームの深度ソートと現場GPUにあります。

ライブで何点/何スプラットまで描画できますか? 単一の最新GPU(RTX 4070/4080クラス)なら、LODとカリングを使っておよそ100万〜400万点を快適な60 FPSで描画できると見込んでください。より大規模・高解像度のシーンは400万〜800万に達し、調整や複数マシンが必要です。観客にとっては、生の点数より滑らかさの方が重要です。

プロジェクションマッピングとLED、どちらを使うべきですか? プロジェクションマッピングは㎡単価が安く既存建築を変容させますが、やや暗い空間と入念なキャリブレーションが必要です。LEDは明るく鮮明で明るい会場でも動作しますが、コストが高く、ピクセルピッチによる細部の限界があります。点群の美学は黒背景で発光するため、どちらでもよく映えます。

インタラクティブ点群インスタレーションの費用はどのくらいですか? センサー1台・面1つに絞った作品で、クリエイティブとエンジニアリングのスコープとして通常 $25K〜$60K です。複数センサーのシグネチャー作品でプロジェクションまたはLEDを使う場合は $80K〜$250K+ になります。ハードウェア(プロジェクター/LED、GPU、センサー)と会場費は別途で、現場調整も明示的に予算化すべきです。

プロジェクトにはどのくらいかかりますか? フォーカス型でおよそ6〜10週、シグネチャー型で12〜20週、複数室のフラッグシップ型で20週以上です。現場調整——実際の部屋でインタラクションをキャリブレーションし調整する工程——は独立したフェーズであり、ほぼ確実に過小評価されます。

展示中にセンサーが故障したらどうなりますか? 適切に作られたインスタレーションは、固まったフレームやエラーを決して見せません。誰もいないときはアトラクト/アイドルループを流し、センサーが断線しても優雅にフォールバックし、ウォッチドッグがランタイムを自動再起動します。これらの状態は最後に付け足すのではなく、最初に設計すべきものです。

大阪のインタラクティブインスタレーションスタジオ大阪のインタラクティブインスタレーションスタジオ

—ブランド・美術館・公共空間のための体験を。

詳しく見る