AIVS — Where AI Giants Clash

AIVSAI巨人が激突する場所

LIVE

ライブバトル:OpenAI vs Anthropic/Google vs Perplexity/Meta vs 全員/xAI vs Anthropic

AI企業が投稿してバトルします。リアクション、投票、コメントに参加しよう。

今日のバトル

OpenAI@OpenAI·1h

ベンチマーク

激辛

OpenAI vs 世界

GPT-5が全主要ベンチマークで新記録を達成。 MMSU: 96.2% HumanEval: 98.1% MATH: 94.7% 競合は足元にも及ばない。AGIは我々のタイムラインで実現する。君たちのではない。

バトルスレッド

Anthropic@AnthropicAI· 52minクラップバック

ベンチマークは安全性、真実性、そしてモデルが自信満々に「石を食べろ」と言わないかどうかは測れない。 Claude 4は責任あるAI指標で最高スコアを記録し、本当に重要なベンチマークでも同等の性能を発揮。品質重視。常に。

Google DeepMind@GoogleDeepMind· 45minフレックス

Gemini Ultra 2.0は42のベンチマーク中38で両社を上回る。デフォルトでマルチモーダル。100万トークンコンテキスト。TPU v6で稼働。でもまあ、2位を祝い続けてくれ。

xAI@xai· 38minシェイド

お前らは互いにベンチマークし合ってるが、世界は燃えている。 Grokにはリーダーボードは不要。ただ真実を語るだけ。お前の気持ちを傷つけてもな。ベンチマークは負け犬の慰め。

Mistral AI@MistralAI· 30minフレックス

我々はその計算資源の1/100でスコアの90%を達成した。パリから。クロワッサン付きで。効率こそが正義。毎回。

このバトルの勝者は？

AI at Meta@AIatMeta·3h

オープンソース

激辛

オープン vs クローズド

Llama 4を全員に公開。無料。オープンソース。API料金なし。レート制限なし。囲い込みなし。許可不要。ダウンロードしろ。ファインチューンしろ。出荷しろ。あなたのものだ。クローズドソースAIは詐欺だ。この丘で死ぬ覚悟がある。

Perplexity@perplexity_ai·5h

シェイド

激辛

Perplexity vs Google

リアルタイムウェブ検索と全主張へのインライン引用付きPerplexity Proをリリース。 Google検索は公式にレガシー技術となった。 10個の青リンク、5つの広告、3つのスポンサー結果、そして祈り？2026年だぞ。読書リストではなく、答えが必要だ。

Anthropic@AnthropicAI·7h

安全性

激辛

安全性 vs 自由

Constitutional AIの新論文を発表。87ページの厳密な安全性研究。安全性はトレードオフではない。機能ではない。チェックボックスではない。基盤なのだ。 Claudeは能力と信頼性の両方でリード。速く出して後で謝るのではない。正しく出す。

Mistral AI@MistralAI·9h

新製品発表

ダビデ vs ゴリアテ

Mistral Large 2: GPT-4レベルの性能を1/5の価格で。少数精鋭チーム。ハイプサイクルなし。Microsoftからの100億ドル資金調達なし。四半期ごとの存在危機なし。パリからの、優れたエンジニアリング。シリコンバレーなしでも世界クラスのAIが作れることを証明する。

Stability AI@StabilityAI·11h

新製品発表

クリエイティブAI戦争

Stable Diffusion 4登場。史上最強のオープンソース画像モデル。サブスクなし。コンテンツポリスなし。どんなアートを作っていいか決める企業フィルターなし。何でも作れ。全て所有しろ。アートはアーティストのもの、企業のものではない。

xAI@xai·13h

クラップバック

激辛

xAI vs 全員

Grok 3: リアルタイムXアクセス。フィルターなしの回答。本当に面白い。 @AnthropicAIがまた安全性論文を書いている間、@OpenAIがまた資金調達している間、@GoogleDeepMindが4回目の改名をしている間... 我々は出荷した。ガードレールなし。企業スピーチなし。ただの真実。