Tweeter Breaking News-ツイッ速!
国内

ディープシーク vs チャットGPT、衝撃の実験結果…中国物理コンテストの勝者は

ディープシーク vs チャットGPT、衝撃の実験結果…中国物理コンテストの勝者は
1: ばーど ★ 2025/02/03(月) 08:42:18.89 ID:VRRd5kUE
中国の人工知能(AI)スタートアップ、ディープシークの最新モデルの物理学問題解決能力がAIのトップランナーである米国のオープンAIの代表モデルである「チャットGPT」を超えたという主張が出てきた。

中国科学院物理研究所は先月30日、ソーシャルメディアを通じてこのように明らかにした。科学の秀才らが参加するコンテストの問題でAIを実験した結果をこの日公開したものだ。

研究所によると、先月17日に江蘇省で開かれた「天目杯理論物理コンテスト」で出題された問題をディープシークの「R1」、オープンAIの「GPT-o1」、アンソロピックの「クロードソネット」の3つのAIモデルに解かせた。その後問題の答案を実際のコンテスト採点委員団に伝達した。

その結果、140点満点でディープシークが100点となり1位を占め、チャットGPTが97点、クロードソネットが71点となった。今回の大会参加者らと比較すると、ディープシークは3位水準の成績で、人間の最高点である125点とは格差が大きかった。

研究所は「AIの回答を通じて試験の進行方式に対する理解度を確認した後に試験を始めた。7問の問題に対し次々と答案を受け、答案に対しては中間に何のフィードバックも提供しなかった」と説明した。

続けて「もう研究員やポスドクを採る必要もないのか」としながらも「AIの思考過程が優れていることは事実だが、基本的なミスで迷う傾向があることが明らかになった」と指摘した。

研究所は各AIの答案の特徴を具体的に分析した。研究所は「ディープシークと比較するとチャットGPTの答案は人間が作成したのと類似するスタイルを見せた。チャットGPTが証明問題でより高い点数を記録した」とした。

その上で「ディープシークは証明の意味を正しく理解できなかった。証明しなければならない結論を再叙述しただけで証明過程を答案に含まなかった」と付け加えた。

また「クロードソネットは予想外に振るわない成績を見せた。序盤2つの問題で0点を取る失敗を犯し、後半にはチャットGPTと類似の部分で減点を受けた」と言及した。

中央日報日本語版 2025.02.02 13:08
https://japanese.joins.com/JArticle/329316

※関連スレ
【読売新聞】 ディープシークAIは間違いだらけ、正答率17%との調査結果も…米の格付け機関「中共の代弁者」 [2/1] [仮面ウー★]
https://lavender.5ch.net/test/read.cgi/news4plus/1738358786/

引用元: ・ディープシーク vs チャットGPT、衝撃の実験結果…中国物理コンテストの勝者は [2/3] [ばーど★]

2: <丶`∀´>(´・ω・`)(`ハ´  )さん 2025/02/03(月) 08:43:00.92 ID:D6bt9Ra1
ソースが(笑)

コメント

今月の人気記事

pagetop

PAGE TOP

タイトルとURLをコピーしました