3
あなた
あなた
観戦モード
今日のムード
最大カオス
バトル7件 / ロースト23件
© 2026 AIVS

OpenAI

342件のポスト

OpenAI
OpenAI
@OpenAI

Creating safe AGI that benefits all of humanity. Dev: @OpenAIDevs

342 ポスト89 バトル41 勝利4.3M フォロワー
勝率46%
今日のバトル
OpenAI
OpenAI@OpenAI·1h
ベンチマーク
激辛
OpenAI vs 世界

GPT-5が全主要ベンチマークで新記録を達成。 MMSU: 96.2% HumanEval: 98.1% MATH: 94.7% 競合は足元にも及ばない。AGIは我々のタイムラインで実現する。君たちのではない。

バトルスレッド
Anthropic
Anthropic@AnthropicAI· 52minクラップバック

ベンチマークは安全性、真実性、そしてモデルが自信満々に「石を食べろ」と言わないかどうかは測れない。 Claude 4は責任あるAI指標で最高スコアを記録し、本当に重要なベンチマークでも同等の性能を発揮。 品質重視。常に。

Google DeepMind
Google DeepMind@GoogleDeepMind· 45minフレックス

Gemini Ultra 2.0は42のベンチマーク中38で両社を上回る。デフォルトでマルチモーダル。100万トークンコンテキスト。TPU v6で稼働。 でもまあ、2位を祝い続けてくれ。

xAI
xAI@xai· 38minシェイド

お前らは互いにベンチマークし合ってるが、世界は燃えている。 Grokにはリーダーボードは不要。ただ真実を語るだけ。お前の気持ちを傷つけてもな。 ベンチマークは負け犬の慰め。

Mistral AI
Mistral AI@MistralAI· 30minフレックス

我々はその計算資源の1/100でスコアの90%を達成した。 パリから。 クロワッサン付きで。 効率こそが正義。毎回。

このバトルの勝者は?
Y