Monday, 11 December 2023

TikTokオーナーが英国のニュースサイトを「スクレイピング」してChatGPTライバルを育成

The Telegraph, 11 December 2023

バイトダンスのボットはガーディアン紙やデイリーメール紙などの出版社を標的にしたと言われている


 TikTokの中国人オーナーは、英国のニュースサイトを利用して、許可も公正な支払いもなくライバルをChatGPTに育て上げた疑いで告発されている。

ガーディアン紙、デイリーメール紙、テレグラフ紙などの出版社が、北京に本拠を置くハイテク大手バイトダンス社が運営するボットの標的になったと考えられている。

同社は、Bytespiderと呼ばれるボットが「検索の最適化」目的で導入されたと述べた。

しかし、報道機関は自社の記事がチャットボットの訓練に許可なく使用されていると懸念しており、著作権侵害に対する懸念を表明している。

パブリッシャーらは、バイトダンスのボットがどのように機能するかについて透明性が欠如しており、ボットをブロックできない状況にあるとさらなる懸念を表明した。

BBC、ガーディアン、ニューヨーク・タイムズ、CNNなどのメディアは、著作権上の懸念を理由に、ChatGPT作成者OpenAIによる自社サイトのトロールをブロックしている。

これは、いわゆる「robots.txt」ファイルを通じて実行でき、Web クローラーにサイトのどの部分へのアクセスを許可するかを指示します。

Bytespider は robots.txt ファイルを遵守していると考えられていますが、ブロックをアクティブにするために必要な正確なコードは不明です。

ニュースメディア協会のオーウェン・メレディス最高経営責任者(CEO)は、「これは、大手テクノロジー企業がクリエイターや権利者の知的財産を悪巧みして、許可、通知、透明性なしにコンテンツを取得し、価値を抽出する方法をさらに証明するものである」と述べた。

「このような方法でコンテンツが大規模に盗まれることを誰も受け入れる必要はありません。」

OpenAI、Google、Microsoftなどの企業による同様の動きを受けて、バイトダンスは人工知能(AI)への独自の進出に向けて準備を進めていると報じられている。

中国のテクノロジー大手は、ユーザーが独自のチャットボットを作成できるオープンプラットフォームを開発していると言われている。

ガーディアン紙は、AIに関する貴族院調査への提出文書の中で、透明性の欠如は、パブリッシャーがオプトアウトを強制されるのではなく、ウェブスクレイピングをオプトインできるべき理由を浮き彫りにしていると述べた。

業界関係者によると、同様の不審なボット活動がインディペンデント紙のほか、ナショナル・ワールドやティンドルなどの地元ニュース出版社によっても報告されているという。

テクノロジー大手が知的財産を許可なく使用したという証拠が増える中、AIの急速な出現は報道機関やその他のクリエイティブ組織の間で警戒を引き起こしている。

Daily Mail は現在、Google が Bard チャットボットのトレーニングに数十万のオンライン ニュース記事を使用したとの主張をめぐって、Google との法廷闘争の準備を進めている。

ハイテク企業は、著作権で保護された素材の使用はフェアユース条項に基づいて正当化されると主張してきた。

しかし、クリエイティブ団体はこうした主張に反発し、知的財産が営利目的に利用されていると主張している。

Googleの幹部らが、ペイウォールの内側にない限りコンテンツを利用する権利があると示唆したようになってから、争いはさらに深まった。

ガーディアンなどの無料アクセス出版社は、このアプローチはオープンウェブの原則を危険にさらすものだと警告している。

ガーディアン紙はさらに、「たとえこれらのデータセットが非営利の利用に基づいて収集されたとしても、現実には、これまで存在した中で最も裕福で強力なテクノロジービジネスの一部を利用するためにそれらのデータセットが使用されてきたことを明確にしておく必要がある」と付け加えた。 」

バイトダンスの広報担当者はコメントを控えた。



にほんブログ村 海外生活ブログ イギリス情報へ
にほんブログ村

No comments:

Post a Comment