相変わらず生成AIというか推論LLMは「どこまで難しい課題を解けるか」ベンチマーク競争を繰り広げているっぽいんだけど、俺が本当に欲しいのは「そこまで難しい課題なんか解けなくてもいいからとにかく簡単な課題を間違えずに(ハルシネーションを起こさずに)確実に解ける」生成AIなんだよなぁ
1
264
1K
191K
117
数学オリンピックの超難問を解ける生成AI相手に、どうでもいいCSVファイルの列名すらまともに読み込めないのを叱り飛ばしながら修正させ続けなければならないのはマジでディストピアだと思う