『人物に関する知識を問うPersonQAベンチマークで、o3が不正確またはねつ造された情報を生成する確率は33%だったとのこと。o4-miniのスコアはさらに悪く、48%の確率で幻覚を呈しました。』

OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明
https://gigazine.net/news/20250421-openai-hallucinate-o3-o4-mini/


半分の確率で嘘つくAIさんwwwwwwwwwwww