DALLE 3 の生成画像に識別用メタデータが添付へ

2024年2月16日

今週にアップデートされた OpenAI のプライバシーポリシーにて、DALLE 3 生成画像に関するお知らせが更新されたのでメモ。

公式ページの内容

C2PA基準、OpenAIの実装、及びC2PAメタデータ

C2PA基準とは何か、それによって何が可能になるか?
C2PAは、メディアの起源や関連情報を検証するために、出版社、企業などがメディアにメタデータを埋め込むことを可能にするオープン技術標準です。C2PAはAI生成画像だけでなく、カメラメーカー、ニュース組織などもメディアコンテンツのソースと歴史(またはプロビナンス)を証明するために同じ基準を採用しています。

OpenAIのC2PAの実装とは何か?
Web上およびDALL·E 3モデルを提供するAPIで生成された画像には、今後C2PAメタデータが含まれるようになります。この変更は2月12日までにすべてのモバイルユーザーにも展開されます。人々はContent Credentials Verifyのようなサイトを利用して、画像がOpenAIのツールを通じてDALL·E 3モデルによって生成されたかどうかを確認できます。これは、メタデータが削除されていない限り、画像が私たちのAPIまたはChatGPTを通じて生成されたことを示すべきです。

C2PAのようなメタデータは、プロビナンスの問題を解決する万能薬ではありません。それは簡単に、偶発的または意図的に削除されることがあります。例えば、今日のほとんどのソーシャルメディアプラットフォームは、アップロードされた画像からメタデータを削除しており、スクリーンショットの撮影のような行為もまたそれを削除することがあります。したがって、このメタデータが欠けている画像は、ChatGPTまたは私たちのAPIで生成されたかもしれませんし、そうでないかもしれません。

私たちは、プロビナンスを確立するためのこれらの方法を採用し、ユーザーにこれらのシグナルを認識するよう促すことが、デジタル情報の信頼性を高める鍵であると信じています。

ChatGPTやOpenAIのAPIによって生成されたテキストや音声にはC2PAメタデータが含まれるか?
現在、DALL·E 3モデルを提供するChatGPTまたは私たちのAPIで生成された画像のみがC2PAメタデータを含むことになります。

C2PAはファイルサイズにどのような影響を与えるか?
以下に、このデータの追加によって画像サイズがどのように変化するかの例を示します:

APIを通じたPNGの場合、3.1MB → 3.2MB(3%増加)

APIを通じたWebPの場合、287k → 302k(5%増加)

ChatGPTを通じたWebPの場合、287k → 381k(32%増加)

これは遅延にほとんど影響を与えず、画像生成の品質に影響を与えることはありません。

生成された画像に埋め込まれるメタデータは何か?
以下に例を示します:

APIを介して生成された画像

APIを通じて生成された画像には、それが基本となるDALL·E 3モデルによって生成されたことを示す署名が含まれます。

ChatGPTを介して生成された画像

ChatGPT内で生成された画像には、コンテンツがChatGPTを使用して作成されたことを示す追加のマニフェストが含まれます。これにより、以下に示すように、二重のプロビナンス系統が作成されます。

Part 1(ChatGPTで画像が表示されたことを示す第二のメタデータマニフェスト)

Part 2(画像がDALL-E 3を使用して作成されたことを示す初期メタデータマニフェスト)

識別用のサイト

以下のサイトに画像を添付する事でメタデータ内容を確認可能。

ちなみに、昔 Bing Image Creator (中身は DALLE 3)を使って生成した画像を確認してみたところ、以下のようなメタデータが添付されていることを確認。

今後はこのように、生成AIを用いたものには識別用のメタデータを付けるのがスタンダードな振る舞いになっていくのかもしれません。

スポンサーリンク