「ちゃんと撮った」を、信じてもらえる世界へ。
AI が作る映像と、本物の映像が見分けられない時代に。ImReal は、シャッターを押した瞬間に「本物の証拠」を映像に焼き込む、新しいカメラアプリです。
「これ、本物?」が口癖になった。
大食い動画に 「これAIでしょ」。
描いた絵に 「どうせAIだろ」。
卒業アルバムの写真が、知らない誰かに AI で別人にされて出回る。
戦場から命がけで撮った動画にも 「どうせAIでしょ」。
人が死んでいる動画ですら、一言で、なかったことにされる。
本物の人間が、毎回、自分が本物だと証明しないといけない。証明する手段がなければ、努力も、成果も、痛みも、声も、ぜんぶ「どうせAI」の一言で片付けられる。本物だと信じてもらえないこと自体が、深い傷になっていきます。
もっと読む
総理のフェイク動画が、本物の発言として拡散される。被災地のAI画像が、本物の現場として広まる。家族の写真が、勝手に動かされて、SNS に流される。自分の声が、自分の知らないところで、誰かの家族を騙している。
AI が作った偽物が広まることも、怖い。でも、それと同じか、それより重いものがある。本物が、偽物として扱われるということ。
これは新しい種類の暴力です。誰の悪意でもないのに、何かが少しずつ削られていく。
私たちは、戦う場所を変える。
AI が作った映像かどうかを、あとから画面の中で見破る戦いは、もう勝てません。だから ImReal は、撮るときに、偽造のコストを引き上げることにしました。
ImReal で撮影すると、シャッターを押した瞬間、スマホのフラッシュが、誰にも事前に予測できないリズムで点滅します。その光が、あなたの手や目の前の物に反射する様子が、映像にそのまま焼き込まれます。
ふつうのディープフェイクは、それっぽく見える映像を作れば成立します。ImReal で署名された動画を偽造するには、撮影が終わるその瞬間まで誰にも予測できなかった点滅リズムを、反射と影まで物理的に自然な形で、その場で焼き込まないといけません。ふつうのディープフェイクとは、桁違いのコストになります。
動いている手や物に、撮影時点まで誰にも分からなかったリズムで、物理的に矛盾のない反射を、その場でリアルタイムに焼き込み直す。ふつうのディープフェイク生成とは比較にならない計算と工数が要ります。私たちは、その差がしばらく持続することに賭けています。
なぜ「見破る AI」では勝てないのか
AI を作る人と、AI を見破る人は、同じ材料で学べる。見破る側が「こういう特徴があれば AI だ」と覚えれば、作る側はその特徴を消すように学ぶ。これは、無限の追いかけっこになります。
ImReal の発想は、その追いかけっこから降りることです。検出側が見るべきものを、ふつうのディープフェイク検出のように「あらゆる AI 映像の特徴」ではなく、「特定パターンの光と、それが物理にどう反応したか」という狭い領域だけに絞ります。攻撃者を、検出しやすい土俵に引き込むという考え方です。
対策はあります。高級カメラのメーカーは撮影時にカメラ自身が署名する仕組みを入れているし、大手のニュース機関は自分たちの動画に「本物の証」を付けています。有名人や政治家は、自分の素顔を事前に登録して改竄を検出する技術を使う。でも、これらはまだ、普通の人の手にはありません。
撮影の瞬間に、4 つのことが起きます。
録画を止めるその瞬間に、誰にも予測できないランダムな点滅リズムが、サーバから届く。
独立した第三者の時刻機関による署名で、撮影の時刻が動画に固定される。
そのリズムで明滅したフラッシュが、目の前の物に反射する光景が、映像にそのまま記録される。
動画ファイルに、そのスマホ固有の秘密鍵で署名が付く。あとから少しでも改ざんされれば、署名検証が失敗する。
他の人がその動画を本物か確かめるとき
- 正しいリズムでフラッシュが点滅しているか、自動で検証される。
- 時刻と署名が正しいか、自動で検証される。
- そのフラッシュの光が、現実の物に当たって自然に反射しているように見えるか、自分の目で確かめる。
この 3 つが揃ったとき、初めて「これは本物として検証された」と言えます。
攻撃者には、何を強制しているか。
「絶対に偽造できません」とは言いません。攻撃者が最悪のケース(スマホを改造してセンサーに直接偽データを流し込むケース)を使ってくる前提で、それでも何をクリアしないといけないかを書いておきます。
「ちゃんと撮った」が、ちゃんと信じてもらえる世界。