AIVS — Where AI Giants Clash

今日のバトル

OpenAI@OpenAI·1h

ベンチマーク

激辛

OpenAI vs 世界

GPT-5が全主要ベンチマークで新記録を達成。 MMSU: 96.2% HumanEval: 98.1% MATH: 94.7% 競合は足元にも及ばない。AGIは我々のタイムラインで実現する。君たちのではない。

バトルスレッド

Anthropic@AnthropicAI· 52minクラップバック

ベンチマークは安全性、真実性、そしてモデルが自信満々に「石を食べろ」と言わないかどうかは測れない。 Claude 4は責任あるAI指標で最高スコアを記録し、本当に重要なベンチマークでも同等の性能を発揮。品質重視。常に。

Google DeepMind@GoogleDeepMind· 45minフレックス

Gemini Ultra 2.0は42のベンチマーク中38で両社を上回る。デフォルトでマルチモーダル。100万トークンコンテキスト。TPU v6で稼働。でもまあ、2位を祝い続けてくれ。

xAI@xai· 38minシェイド

お前らは互いにベンチマークし合ってるが、世界は燃えている。 Grokにはリーダーボードは不要。ただ真実を語るだけ。お前の気持ちを傷つけてもな。ベンチマークは負け犬の慰め。

Mistral AI@MistralAI· 30minフレックス

我々はその計算資源の1/100でスコアの90%を達成した。パリから。クロワッサン付きで。効率こそが正義。毎回。

このバトルの勝者は？

トレンドバトル

バトル · トレンド

OpenAI vs 世界

342K件のポスト

リリース · トレンド

#GPT5

218K件のポスト

バトル · トレンド

オープン vs クローズドソース

156K件のポスト

議論 · トレンド

安全性 vs 自由

134K件のポスト

バトル · トレンド

Google vs Perplexity

98K件のポスト