Tweeter Breaking News-ツイッ速!
国内

【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か

【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か

24時間内人気記事

1: 牛乳トースト ★ 2024/12/16(月) 17:26:31.60 ID:8ghhqTwZ9
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。過去10年間でAIは爆発的な成長を遂げており、特に人間の文章を解析してもっともらしい文章を返す能力には目を見張るものがありますが、こうした能力はすべて、インターネット上に存在する既存の文章などさまざまなデータを学習した上で構築されたものです。

インターネット上には膨大な量のデータが存在することは間違いないのですが、研究機関のEpoch AIによると、AIはインターネット上のデータを驚くべきスピードで学習し続けており、そのほとんどを食い尽くしてしまう可能性があるとのことです。

Epoch AIは「2028年頃までに、AIモデルの学習に使用されるデータセットのサイズは、インターネット上に存在する文章の総ストックと同じサイズに達する」と予測。これはつまり、2028年頃までにAIは学習データを使い果たしてしまう可能性が高いということを意味します。データセットが不足することに加え、新聞社などのデータ所有者がコンテンツの利用を取り締まり始め、アクセスをさらに厳しくしているのもAI研究者にとってのハードルとなっています。

こうした問題はAI研究者の間でも認知されており、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという法則が語られることがあります。データセットの不足を補うため、AI研究者は学習の方法を変更するなどしてAIの性能向上を模索しています。

*記事全文は以下ソースにて
2024年12月16日 17時00分 GIGAZINE
https://gigazine.net/news/20241216-ai-data-running-out/

引用元: ・【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か [牛乳トースト★]

2: 名無しどんぶらこ 2024/12/16(月) 17:27:10.60 ID:q0KeHH8w0
AIよりYoutubeで大宮公園のピース君見てた方が楽しいからな
3: 名無しどんぶらこ 2024/12/16(月) 17:27:52.34 ID:tzcaRSat0
もう学び尽くしたのか
4: 名無しどんぶらこ 2024/12/16(月) 17:28:29.69 ID:BtnXcxza0
AIの学習データをAIが作ればええやん
5: 警備員[Lv.13] 2024/12/16(月) 17:28:53.28 ID:aSubuyfu0
ちょっと何言ってるかマジで分からない
6: 名無しどんぶらこ 2024/12/16(月) 17:29:26.08 ID:feMyoDNr0
ネットに上がってない情報を食べさせるんかな
7: 名無しどんぶらこ 2024/12/16(月) 17:30:20.49 ID:IfedJnkh0
つまり図書館で文献を取ってページめくっての動作をするロボットがいるのか

コメント

今週の人気記事

pagetop

PAGE TOP

タイトルとURLをコピーしました