banner
ニュース センター
総合企業

AIに対するデータ反乱が勃発

Jun 03, 2023

広告

による支援

AI企業が同意なしにオンラインコンテンツを消費することにうんざりし、ファンフィクション作家、俳優、ソーシャルメディア企業、報道機関などが反乱を起こしている。

シーラ・フレンケル、スチュアート・A・トンプソン著

シーラ・フレンケルとスチュアート・トンプソンは、オンラインの誤った情報とデジタルデータについて報告します。

キット・ロフシュタットは、20 年以上にわたり、「スター・ウォーズ」のヒーローや「バフィー ザ ヴァンパイア スレイヤー」の悪役たちの別世界を探索するファン フィクションを書き、そのストーリーをオンラインで無料で共有してきました。

しかし、ロフシュタットさんは5月、データ会社が彼女のストーリーをコピーし、バイラルチャットボットであるChatGPTの基盤となる人工知能技術に流し込んだことを知り、自身の作品の投稿をやめた。 狼狽した彼女は、鍵のかかったアカウントの後ろに書いたものを隠した。

ロフシュタットさんは先月、AIシステムに対する反乱行為の組織化にも協力した。 彼女は他の数十人のファン フィクション作家とともに、作家の作品を AI テクノロジーにフィードするデータ収集サービスを圧倒し、混乱させるために、不遜な物語の洪水をオンラインで公開しました。

英国サウスヨークシャー出身の42歳の声優ロフシュタットさんは、「私たち一人ひとりができる限りのことをして、私たちの創造性の成果が機械の好きなように収穫できるものではないことを彼らに示さなければなりません」と語った。

テクノロジーに対する熱狂がシリコンバレーと世界を襲う中、ファンフィクション作家は現在、AIシステムに対して反乱を起こしているグループの1つにすぎない。 ここ数カ月間、レディットやツイッターなどのソーシャルメディア企業、ニューヨーク・タイムズやNBCニュースなどの報道機関、ポール・トレンブレイや女優のサラ・シルバーマンなどの作家が、AIによるデータの無断吸い取りに反対する立場をとっている。

彼らの抗議活動はさまざまな形をとっています。 作家やアーティストは作品を保護するためにファイルをロックしたり、AI で生成されたコンテンツを公開する特定の Web サイトをボイコットしたりしている一方で、Reddit のような企業はデータへのアクセスに料金を請求したいと考えています。 今年、同意なしにアーティストの創作作品に基づいてシステムをトレーニングしたとして、AI企業に対して少なくとも10件の訴訟が起こされている。 先週、シルバーマン氏と著者のクリストファー・ゴールデン氏とリチャード・カドリー氏は、AIによる著作物の利用を巡り、ChatGPTの開発者であるOpenAIなどを訴えた。

反乱の中心にあるのは、オンライン情報(ストーリー、アートワーク、ニュース記事、掲示板の投稿、写真)には未開発の重要な価値がある可能性があるという新たな理解です。

AI の新しい波は、生成されるテキスト、画像、その他のコンテンツから「生成 AI」として知られており、人間らしい散文を生成できる大規模な言語モデルなどの複雑なシステムの上に構築されています。 これらのモデルは、あらゆる種類のデータの蓄積に基づいてトレーニングされるため、人々の質問に答えたり、文体を模倣したり、コメディや詩を量産したりすることができます。

これにより、テクノロジー企業は自社のAIシステムに供給するためのさらなるデータを求める動きを開始した。 Google、Meta、OpenAI は基本的に、ファン フィクションの大規模なデータベース、ニュース記事の宝庫、書籍コレクションなど、インターネット全体からの情報を使用しており、その多くはオンラインで無料で入手できました。 テクノロジー業界の用語では、これはインターネットの「スクレイピング」として知られています。

2020 年にリリースされた OpenAI の AI システムである GPT-3 は 5,000 億の「トークン」に及び、それぞれは主にオンラインで見つかった単語の一部を表しています。 一部の AI モデルは 1 兆を超えるトークンにまたがります。

インターネットのスクレイピング行為は長年にわたって行われており、その行為を行った企業や非営利団体によって大部分が公開されていました。 しかし、データを所有する企業には十分に理解されていなかったり、特に問題があるとは考えられていなかったりしました。 ChatGPT が 11 月にデビューし、チャットボットを動かす基礎となる AI モデルについて一般の人々がさらに学ぶようになってから状況は変わりました。

「ここで起こっていることは、データの価値の根本的な再調整です」と AI 企業 Nomic の創設者兼最高経営責任者、Brandon Duderstadt 氏は述べています。 「以前は、データを誰にでも公開し、広告を掲載することでデータから価値が得られると考えられていました。 さて、データを AI への入力として使用すると、より多くの価値を引き出すことができるため、データをロックすると考えられます。」