Ystudio / PIXTA(ピクスタ)

生成AI、画像の特徴が似ていれば「著作権侵害」にあたる？文化庁の最新見解を読み解く

2023年06月19日 10時04分

AIと著作権にまつわる議論が続く中、政府がこのほど公表した文化庁の資料（*）が注目を集めている。

この資料は著作権法とAIについてまとめたもので、「AI開発・学習段階」と「生成・利用段階」に分けて、それぞれ著作権法の適用が異なることを明示している。

「AI開発・学習段階」については、2018年の著作権法改正により新たに規定された著作権法30条4が適用されて、「原則として著作権者の許諾なく利用することが可能」と説明する。「生成・利用段階」はこれまで通りのルールが適用される。

問題は「AI開発・学習段階」につけられていた注釈だ。元画像の「表現上の本質的な特徴」を感じ取れるような映像の作成を目的としておこなう場合は、この規定の対象とはならないとしている。

AIと著作権法にくわしい柿沼太一弁護士は「かなり踏み込んだ内容」と指摘する。現在、AI生成画像が「著作権侵害だ」と指摘される事例が相次いでいる中、どのように考えたらよいのだろうか。柿沼弁護士に見解を聞いた。

●判断が難しい「学習対象となった既存著作物への依拠性」

——AIで生成した画像について「著作権侵害ではないか」と指摘されることが多くなっています。

著作権侵害の要件は大きく分けると「既存著作物との同一性・類似性」と「既存著作物への依拠性」の2つです。

前者の「既存著作物との同一性・類似性」について、AIは関係ありません。これまでの膨大な判例を元に、判断基準がほぼ確立しています。

たとえ「作風・画風」が類似していたとしても、「同一性・類似性」があることにはなりません。これは文化庁の資料に記載されているとおりです。

問題は「依拠性」のほうです。実は、この「依拠性」もさらに2つに分けて考える必要があります。

1つは「学習段階で学習対象となった既存著作物への依拠性」で、もう1つは、画像生成AIにおける「i2i」（簡単に元絵を改変できる機能）や文章作成AIにおける要約・翻訳のような「利用段階（生成段階）で入力対象となった既存著作物への依拠性」です。

このうち「利用段階（生成段階）で入力対象となった既存著作物への依拠性」は問題なく肯定されると思います。既存著作物を認識しつつ入力しているからです。

難しいのは「学習対象となった既存著作物への依拠性」です。

画像生成AIの場合、学習段階では、特定のテキストと画像を紐付けて学習（パラメータの更新）しています。そして、利用段階で、ある特定のテキスト（プロンプト）が入力されれば、そのテキストをうまく表現するような画像を生成して出力するという技術的な仕組みとなっています。

このような技術的な仕組みである以上、依拠性を判断するに際しては、単純に「学習対象に既存著作物が含まれていれば依拠性あり」ではなく、学習段階で、どのような学習をおこなっているか（具体的には、どのようなテキストとどのような画像を紐付けて学習しているか）、そして利用段階でどのようなテキスト（プロンプト）を入れているかを問題にしなければならないのではないかと考えています。

画像タイトル 文化庁が公表した資料

●ユーザーは「依拠性」をどう気をつければいいのか

——AIで画像を生成する際、ユーザーは「依拠性」についてどのように気をつければよいでしょうか。

フローで考えると、わかりやすいかもしれません。

（1）生成者が既存著作物を知っているか → 知っていれば依拠性あり、知らなければ（2）に

（2）既存著作物が学習用データに含まれているか →含まれていなければ依拠性なし、含まれていれば（3）へ

（3）当該学習用データ（画像）を学習過程で用いる際に、特定のテキストと、当該データ（画像）の表現上の本質的特徴が強固に結びついているか →結びついていなければ依拠性なし、結びついていれば（4）へ

（4） 利用段階で（3）における「特定のテキスト」をプロンプトとして入力しているか 　→入力していれば依拠性あり、入力していなければ依拠性なし（独自創作）

たとえば、有名キャラクターを生成した場合には、ほとんど（1）の段階で依拠性が肯定されると思います。一方、偶然生成されたケースについては、（2）以下の判断に進みます。

具体例を考えてみましょう。

たとえば、「ピカチュウ」というキャラクターをまったく知らない人がいるとします（（1）をクリアして（2）に進む）。

「ピカチュウ」の画像が学習用データに入っているとすると、（2）をクリアします。この場合、学習段階で、「ピカチュウ」というテキストを付してピカチュウの画像が学習対象となっており（3）、かつ利用者が「ピカチュウ」というテキストをプロンプトして入力して（4）（まあ、ピカチュウのことを知らない人が「ピカチュウ」というテキストを入力する可能性は非常に低いですが）、ピカチュウ画像が出力されたら「依拠性あり」です。

一方、「アニメ、かわいい、二頭身、黄色いモンスター」というテキストを付して「ピカチュウ」の画像が学習対象となっており（3）、かつ利用者が「アニメ、かわいい、二頭身、黄色いモンスター」テキストを入力して（4）、ピカチュウ画像が出力されたら「依拠性なし」になります。

●「かわいい、二頭身、黄色いモンスター」でピカチュウが出てきたら…

——「アニメ、かわいい、二頭身、黄色いモンスター」というテキストでピカチュウが出てても、「依拠性なし」のこともあるわけですね。

「ピカチュウ」というテキストは、あのピカチュウの画像（ピカチュウの表現上の本質的特徴を有する画像）としか結びつきませんから、学習段階で「ピカチュウ」というテキストを付してピカチュウの画像を学習している場合、「特定のテキストと、当該データ（画像）の表現上の本質的特徴が強固に結びついている」ことになります。

一方、「アニメ、かわいい、二頭身、黄色いモンスター」というテキストは特定の画像と結びついている訳ではありません。

「アニメ、かわいい、二頭身、黄色いモンスター」というテキストを付してピカチュウの画像を学習していたとしても、「アニメ」「かわいい」「二頭身」「黄色いモンスター」というテキストは、別のテキストと組み合わされて、それぞれまったく異なる画像と結びつけて学習されているはずです。

この場合「特定のテキストと、当該データ（画像）の表現上の本質的特徴が強固に結びついている」訳ではありません。

その結果、利用段階で「ピカチュウ」というテキストをプロンプトとして入力すればピカチュウの画像（ピカチュウの表現上の本質的特徴を有する画像）が出力される可能性が極めて高くなりますが、「アニメ、かわいい、二頭身、黄色いモンスター」というテキストを入れることによりピカチュウの画像が出力される可能性は極めて低くなります。

そして、前者の場合においてピカチュウの画像が出力されれば依拠性は肯定され、後者の場合において万が一ピカチュウの画像が出力されても依拠性はないのではないか、というのが私の意見です。

●AI開発・学習段階でも「著作権侵害」の可能性あり？

——文化庁の資料について、「かなり踏み込んだ内容」と指摘しています。どのような点がこれまでにない部分になりますか？

まず、著作権の適用を「AI開発・学習段階」と「生成・利用段階」とで分けていることは、当然のことであり、特に目新しい点ではありません。

また、「著作権は、『思想又は感情を創作的に表現した」著作物を保護するものであり、単なるデータ（事実）やアイデア（作風・画風など）は含まれない』『AIを利用して生成した画像等をアップロードして公表したり、複製物を販売したりする場合の著作権侵害の判断は、著作権法で利用が認められている場合を除き、通常の著作権侵害と同様』『生成された画像等に既存の画像等（著作物）との類似性（創作的表現が同一又は類似であること）や依拠性(既存の著作物をもとに創作したこと)が認められれば、著作権者は著作権侵害として損害賠償請求・差止請求が可能であるほか、刑事罰の対象ともなる」という点についても、従来の議論を確認したにすぎず、違和感はありません。

ただ、「AI開発・学習段階」の非享受利用について、次のような記載がありました。

「※1 例えば、3DCG映像作成のため風景写真から必要な情報を抽出する場合であって、元の風景写真の『表現上の本質的な特徴』を感じ取れるような映像の作成を目的として行う場合は、元の風景写真を享受することも目的に含まれていると考えられることから、このような情報抽出のために著作物を利用する行為は、本条の対象とならないと考えられる」

これは「ある特定のキャラクターの『表現上の本質的な特徴』を感じ取れるようなキャラクター映像の作成を目的として当該キャラクターのイラストから必要な情報を抽出する」行為にも当然あてはまります。

AIの文脈に即して少し抽象化すると「学習対象著作物の『表現上の本質的な特徴』を感じ取れるような著作物の作成を目的として、学習対象著作物から必要な情報を抽出する」行為と言い換えることができます。

要は「学習行為」（情報解析行為）であっても、当該学習行為の結果生成されたAIモデルからの出力が著作権侵害に該当する可能性がある場合には、享受利用に該当するという解釈なのでしょう。

このような行為は、これまで但書の「著作権者の利益を不当に害することとなる場合」に該当するのではないかとする説もありましたが、この資料は「享受利用」に該当するという説のようで、私はこのような見解を初めて見ました。

この考え方は、「AI開発・学習段階」と「生成・利用段階」を分けて考えるべきとしつつ、結局「生成・利用段階」での著作権侵害の可能性を理由に、前段階である学習行為（情報解析行為）を制限しようとする考え方なので、条文解釈として個人的には疑問があります。

「学習行為」というある著作物の利用行為の「享受」「非享受」の判断において、まだ現実に生じていない著作権侵害の可能性を考慮することができるのかということです。「どのような場合にAI学習を制限すべきか」という重要論点は、これからさらに議論が進んでいくのではないでしょうか。

（*）AIと著作権の関係等について
https://www8.cao.go.jp/cstp/ai/ai_team/3kai/shiryo.pdf

この記事は、公開日時点の情報や法律に基づいています。