埃隆·马斯克是不是发明了通用人工智能(AGI)?关于 Grok 4 你需要知道的一切以及如何试用它
埃隆·马斯克的人工智能公司xAI刚刚投下了一颗重磅炸弹:Grok 4发布了——它速度快、智能,并且已经登顶各大排行榜。甚至有人说它是通用人工智能(AGI)。
Grok 4是什么?
Grok 是 xAI 对标 ChatGPT、Claude 和 Gemini 的产品。它支持多模态交互,可通过 API 访问,目前提供两种版本:
- Grok 4(基础型号)
- Grok 4 Heavy(一个能够并行思考的多智能体强大系统)
xAI声称其在学术任务上的表现优于博士水平——这是马斯克的原话,不是我的 ;)
基准对决
Grok 4 在实际应用中已经超越了大多数型号:
| 基准 | Grok 4 | Grok 4 重型 | o3(OpenAI) | Gemini 2.5 Pro |
|---|---|---|---|---|
| 人类的最后考试(无工具) | 25.4% | — | 21% | 21.6% |
| 人类的最后考试(附带工具) | — | 44.4% | — | 26.9% |
| ARC-AGI-2 | 16.2% | — | 约8% | 约6% |
🧠 这可是顶尖水平——尤其是 ARC-AGI 得分,几乎是排名第二的竞争对手的两倍。不管你怎么评价埃隆·马斯克,这确实令人印象深刻。
它要多少钱?
通过OpenRouter使用 Grok 4很简单,但价格不菲:
-
Grok 4
- 输入:
$3 / million tokens - 输出:
$15 / million tokens
- 输入:
相比之下,OpenAI 的 o3 就更出色了:
- 输入:
$2 / M - 输出:
$8 / M
此外,还有每月 300 美元的SuperGrok Heavy计划,可提前体验 Grok 4 Heavy、新代理、编码模型,甚至在今年晚些时候体验视频生成功能。
通过 OpenRouter 尝试 Grok 4
想自己测试一下吗?这里有一个使用OpenRouter 的简单代码片段:
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="<OPENROUTER_API_KEY>",
)
completion = client.chat.completions.create(
model="x-ai/grok-4",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "What is in this image?"},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
}
}
]
}
]
)
print(completion.choices[0].message.content)
没错,多模态!输入图像,输出答案。
最后想说的
凭借惊人的基准测试结果和马斯克一贯的宣传造势,Grok 4 正在成为一款强有力的竞争者。但它在实际应用中——或者仅仅在 X.com 上——的表现如何,目前还不得而知。
但如果你想体验一下目前最强大的公共模型,它已经可以通过 OpenRouter 上线了。
让我们看看它能做什么。
干杯,
Jonas, sliplane.io的联合创始人
