全球整体使用量 TOP 榜-参考基准
海外地区使用量排序(美国 / 欧洲 / 亚太其他)
1. 第一梯队(主流选择)
Gemini 3 Flash Preview(Google)- 海外开发者首选,速度与成本平衡最优
Claude Sonnet 4.5(Anthropic)- 企业用户主流,长文本与安全性兼顾
Claude Opus 4.5/4.6(Anthropic)- 高端任务首选,复杂推理能力顶尖
GPT-4o/GPT-5(OpenAI)- 品牌认知度高,生态成熟,API 稳定
2. 第二梯队(增长迅速)
Kimi K2.5(Moonshot AI)- 海外收入已超国内,付费用户 4 倍增长
Mistral Large/Codestral(Mistral AI)- 欧洲用户偏好,开源生态友好
Venice AI(隐私优先)- 推荐用于敏感数据场景,支持 Claude/LLama 等模型
Ollama 本地模型(Llama 3.1/3.2/3.3)- 隐私保护强,无需 API 密钥
3. 第三梯队(特定场景)
Amazon Bedrock(AWS)- 企业级部署首选,模型多样性强
OpenRouter(聚合服务)- 适合需要灵活切换多模型的开发者
中国地区使用量排序(大陆 / 港澳台)
1. 第一梯队(本土优势明显)
Kimi K2.5(Moonshot AI)- 断层第一,累计调用量超 390B tokens,免费策略吸引大量用户
通义千问系列(Qwen Max/Plus/Flash)- 阿里云百炼支持,本土化适配最佳,API 费用低
Trinity Large Preview(国产)- 近期崛起,中文代码能力突出
2. 第二梯队(主流国际模型)
Claude Sonnet/Opus(Anthropic)- 中文支持优秀,通过 Venice AI 或 OpenRouter 接入MiniMax M2.1(MiniMax)- 国内 API 响应快,价格亲民
GLM-4.7/GLM-4(智谱 AI)- 学术与企业用户青睐,数学推理强
3. 第三梯队(特殊需求)
Ollama 本地模型(Llama 3.1/3.2/3.3/Qwen)- 隐私敏感场景首选,本地化部署无网络依赖
Deepgram(音频转录)- 配合 LLM 处理语音任务,中文转录准确率高
一、海外大模型
1.claude-(Anthropic)
官方网站:https://www.anthropic.com/
API 文档:https://docs.anthropic.com/claude/
完整支持模型:Claude Opus 4.5/4.6、Claude Sonnet 4.5、Claude Haiku 4.5
claude4.5不能接入第三方服务,贵
2.gpt-(OpenAI)
官方网站:https://openai.com/
API 文档:https://platform.openai.com/docs/
完整支持模型:GPT-5.3-Codex、GPT-5.2、GPT-4o、o1-preview、o1-mini
3.Gemini-(Google)
API 文档:https://ai.google.dev/docs/
完整支持模型:Gemini 3 Flash Preview、Gemini 3 Pro、Gemini Ultra
emini 2.5 flash lmage 生图模型 命名:Nano Banana(2025.8.26)
Gemini 3 pro lmage 命名:Nano Banana Pro(2025.11.20)
二、国产大模型
1.kimi(月之暗面)
kimi-k2.5-目前国内最强,海外版有首月0.99美元99的套餐 最大问题 额度抠
完整支持模型:Kimi K2.5、Kimi Coding、Kimi K2-0905-preview、Kimi K2-turbo-preview
kimi-k2.5:Kimi迄今最智能的模型,在Agent、代码、视觉理解及一系列通用智能任务上取得开源SoTA表现
kimi-k2-0905-preview:上下文长度256k,在0711版本基础上增强了AgenticCoding能力、前端代码美观度和实用性、以及上下文理解能力
2.Qwen-(通义千问)
海外版:https://qwen.ai
完整支持模型:千问 Max、千问 Plus、千问 Flash、千问 Coder、Qwen3、Qwen2.5、Qwen2、Qwen3-VL-Plus、Qwen3-Omni-Flash
qwen3-max:通义千问系列效果最好的模型,适合复杂、多步骤的任务
qwen-plus:能力均衡,推理效果、成本和速度介于通义千问Max和通义千问Flash之间,适合中等复杂任务
qwen-flash:通义千问系列速度最快、成本极低的模型,适合简单任务
通义万相 Wan2.2,系阿里
wan2.2 动作迁移和角色替换
3.GLM-(智谱AI)-- GLM4.7 最低每月20元 GLM4.7不如kimi 高峰慢
国内版:主站:https://www.zhipuai.cn API:https://www.bigmodel.cn
海外版:https://z.ai
完整支持模型:GLM-4.7、GLM-4.7-Flash(免费)、GLM-4.6、GLM-4.6V、GLM-4.5-Air、GLM-4.5V、GLM-Image
GLM-4.7:高智能旗舰,通用对话、推理与智能体能力上实现全面升级
GLM-4.6:超强性能,高级编码能力、强大推理以及工具调用能力
GLM-4.5-Air:高性价比,在推理、编码和智能体任务上表现强劲
4.Minimax-(上海稀宇)
完整支持模型:M2.1 系列、M2.1-Lightning、M2.1-Turbo
MiniMax-M2:专为高效编码与Agent工作流而生
MiniMax-M2.1:强大多语言编程能力,全面升级代码工程体验
MiniMax-M2.1-lightning:与M2.1同等效果,速度大幅提升
评论区