https://gigazine.net/news/20250819-ai-iq-test-political-replies/
2025年08月19日 08時00分
AIの性能を測定するベンチマークには「日常タスクの実行精度を検証するテスト」や「計算問題の解答精度を検証するテスト」など多くの種類が存在しています。Maxim Lott氏は各種AIのIQテストの結果や政治的な質問に対する回答をまとめたウェブサイト「Tracking AI」を公開してAIの性能を客観的に比較できるようにしています。
IQ Test | Tracking AI
https://www.trackingai.org/home
Compare Political Replies | Tracking AI
https://www.trackingai.org/compare-political-responses
Tracking AIでは「オンライン上に存在せず、AIの学習に使われていない自作のIQテスト」と「メンサがオンライン上で公開しているIQテスト」が問題として使われています。問題の例が以下。画像の読み取り機能を備えたAIには問題に含まれる図表をそのまま入力し、テキストの入力に特化したAIには「図表を説明する文章」をプロンプロとして入力しました。
(略)
※全文はソースで。
引用元: ・【AI】GPT-5やGrok 4など各種AIのIQテスト対決の結果が公開中&各AIが政治的に左寄りなのか右寄りなのかテストした結果も公開中 [少考さん★]
左翼AI
スタンドアローンで勝負せんと
全てに主観が入る
コメント