大模型介绍

先知道该选哪条路线,再去比参数

这一页不是单纯列模型名,而是帮你先把“适合谁、强在哪、怎么选”理顺。你可以先看国内路线,再对照国外路线,最后按自己的场景做决定。

先把看法对齐

别一上来就追排行榜,先把自己的问题定义清楚。

这页讲什么

这里不是参数表堆砌,而是把主流模型家族按“适合谁、强在哪、怎么选”讲清楚。

覆盖范围

国内部分覆盖 DeepSeek、通义千问、Kimi、GLM、豆包、混元、文心、MiniMax、阶跃星辰、讯飞、零一万物、百川等主流路线;国外部分覆盖 OpenAI、Claude、Gemini、xAI、Mistral、Cohere、Llama、Amazon Nova 等主流家族。

怎么用这页最快

先按你的场景选家族,再看这个家族里哪条模型线最适合你现在这一步,不要一上来就追“最强”。

先记住这几个快规则

如果你现在只是想快速做第一轮判断,这几条最够用。

1
第一次接 API,优先看 DeepSeek、通义千问、GLM,这三条最容易先跑通。
2
做中文业务、客服、办公助手,先看 DeepSeek、Qwen、GLM、混元、文心。
3
读长文档、PDF、研究资料,优先看 Kimi、Gemini、Claude、OpenAI。
4
做代码、Agent、工具调用,优先看 OpenAI、Claude、DeepSeek、Qwen Coder、Mistral。
5
做语音、视频、实时互动和多模态产品,优先看 Gemini、MiniMax、阶跃星辰、讯飞、Amazon Nova。

按场景选会更快

先看你现在属于哪一类任务,再去比具体家族。

只想先把龙虾机器人装起来

这时候别先追最强,先看哪条路线最容易把模型、Key、命令和验证链路一起打通。

DeepSeek通义千问GLM

主要做中文业务、客服、办公助手

这种场景更看中文稳定度、接入便利度和平台治理能力。

DeepSeekQwenGLM混元文心

要读很长的资料、PDF、报告

长上下文、长文保持能力和总结质量通常比单轮聊天观感更重要。

KimiGeminiClaudeOpenAI

代码、Agent、工具调用是重点

这种任务更看代码质量、函数调用、工具链和长链路推理能力。

OpenAIClaudeDeepSeekQwen CoderMistral

要做语音、视频、实时互动

如果产品不是传统聊天框,而是实时互动体验,就先看多模态和音视频能力。

GeminiMiniMax阶跃星辰讯飞Amazon Nova

准备自部署、微调或私有化

这类路线更看开放权重、社区资源和可控性,不一定适合零基础马上上手。

LlamaYiMistralQwen 开源线

国内主流大模型家族

如果你更关注中文环境、国内平台接入和更低上手门槛,先看这一组。

模型家族新手最容易先跑通的一条中文路线

DeepSeek

DeepSeek 的优势是简单、强、成本相对友好。对第一次给龙虾机器人接大模型的人来说,它通常是最顺手的起点。

deepseek-chatdeepseek-reasoner
强在哪
  • - 中文问答和代码都比较稳。
  • - 思考版和通用版分工清楚,选型门槛低。
  • - 适合先把安装、配置、验证链路跑通。
适合谁
  • - 第一次接模型
  • - 预算敏感
  • - 中文问答和代码辅助
选型提醒: 如果你要做很重的语音、视频和实时多模态产品,就不要只看它一条线。
模型家族国内模型线最全的家族之一

通义千问 / Qwen

Qwen 的强项不是单点能力,而是产品线非常完整。文本、推理、代码、视觉、语音、多模态都有对应路线。

Qwen3 Max / Plus / FlashQwen CoderQwen VL
强在哪
  • - 同一家族里能覆盖多种任务。
  • - 阿里云生态成熟,后面接知识库和工作流更顺。
  • - 适合把文本、视觉、代码统一规划。
适合谁
  • - 想一站式接多类模型
  • - 阿里云用户
  • - 长期产品路线
选型提醒: 系列很多,先确认自己需要的是 Max / Plus / Flash,还是 Coder / VL,不然容易挑花。
模型家族长文档、长上下文、资料整理特别舒服

Kimi / Moonshot

Kimi 一直很适合长文档阅读、研究资料整理和长上下文问答。如果你的工作经常要吃大段资料,它很值得重点看。

K2.5K2K2 Thinking
强在哪
  • - 读长资料体验好。
  • - 总结、归纳、写作辅助比较舒服。
  • - 适合研究、报告、PDF 场景。
适合谁
  • - 长文档分析
  • - 资料总结
  • - 报告写作
选型提醒: 如果你只是先把机器人装起来,Kimi 不一定比 DeepSeek 或 Qwen 更省事。
模型家族中文能力、Agent 路线和多模态都比较均衡

GLM / 智谱

GLM 在中文开发者圈一直是很重要的一条路线,尤其适合看中文能力、工具调用和多模态一起落地的团队。

GLM-5.1GLM-5GLM-5V
强在哪
  • - 中文理解稳。
  • - Agent 和工具调用路线明确。
  • - 文本、视觉、图像能力都成体系。
适合谁
  • - 国内替代方案
  • - Agent 工程
  • - 中文与多模态兼顾
选型提醒: 不同版本和名字较多,接入前先看清上下文、视觉能力和调用方式。
模型家族平台化能力强,适合多档位成本控制

豆包 / Doubao

豆包更像平台型路线,轻量版、高配版、视觉版、思考版分工清楚,适合做成本和能力分层。

Doubao 1.5 ProDoubao 1.5 LiteDoubao Vision
强在哪
  • - 档位分层清晰。
  • - 文本和视觉路线都比较完整。
  • - 适合平台化批量调用。
适合谁
  • - 字节生态
  • - 预算分层
  • - 文本 + 视觉混合
选型提醒: 第一次使用时要先看清资源开通、区域和权限,不要只盯模型名。
模型家族企业应用和腾讯云生态里很好接

腾讯混元

混元适合已经在腾讯云体系里,或者要做中文企业助手、客服和办公场景的团队。

hunyuan-t1HY ThinkHY Vision
强在哪
  • - 中文业务场景适配度高。
  • - 文本、推理、视觉路线清楚。
  • - 和腾讯云其他服务联动自然。
适合谁
  • - 腾讯云用户
  • - 企业内部助手
  • - 中文客服
选型提醒: 先确认计费、并发和资源规则,别只看宣传页效果。
模型家族更偏企业托管和平台治理能力

文心 / ERNIE

文心通常要和千帆平台一起看,它的价值不只是单个模型,而是整个平台的治理、托管和组合能力。

ERNIE 5.0ERNIE X1.1ERNIE 4.5
强在哪
  • - 企业托管感强。
  • - 平台治理和模型组合能力完整。
  • - 适合知识库、办公和企业内部应用。
适合谁
  • - 百度云 / 千帆用户
  • - 企业治理
  • - 中文办公场景
选型提醒: 接入前先分清你要的是文心自研模型,还是千帆里的其他第三方模型。
模型家族语音、互动、陪伴型体验更突出

MiniMax

MiniMax 很适合做有“互动感”的产品,尤其是语音助手、角色对话、实时体验类产品。

M2.7M2.5Speech / Voice 路线
强在哪
  • - 互动体验强。
  • - 语音和多模态能力活跃。
  • - 适合做角色化、陪伴型产品。
适合谁
  • - 语音互动
  • - AI 陪伴
  • - 实时产品体验
选型提醒: 如果你当前只是做通用文本问答,没必要一开始就走最复杂的音视频路线。
模型家族实时语音和新交互产品路线很清晰

阶跃星辰 / StepFun

阶跃星辰更适合面向互动体验而不是传统聊天框,它在实时语音和多模态方向很值得关注。

Step-3Step-3.5 Flashstep-audio
强在哪
  • - 实时语音路线明确。
  • - 文本、视觉、音频一起推进。
  • - 适合做新形态交互产品。
适合谁
  • - 实时语音助手
  • - 互动式产品
  • - 多模态探索
选型提醒: 对零基础用户来说,起步复杂度通常高于 DeepSeek 和 Qwen。
模型家族中文办公、教育、语音入口有积累

讯飞星火

讯飞的优势一直不只在文本,还在语音、听写、会议、教育等入口能力,适合中文内容生产和语音相关场景。

Spark MaxSpark ProSpark Lite
强在哪
  • - 教育与办公场景成熟。
  • - 语音转写和会议能力配套足。
  • - 中文内容生产能力稳。
适合谁
  • - 教育办公
  • - 语音转写
  • - 中文内容场景
选型提醒: 如果你只做通用文本 API,先确认自己是不是真的需要它的语音生态能力。
模型家族商业平台和开源路线都值得看

零一万物 / Yi

Yi 的特点是既有商业 API,也有开源影响力。适合同时关注开放平台和开源生态的人。

Yi-LightningYi-LargeYi-Coder
强在哪
  • - 商业与开源双路线。
  • - 代码和多模态都有代表性。
  • - 适合做长期技术储备。
适合谁
  • - 兼顾开源和商用
  • - 代码场景
  • - 中文多模态探索
选型提醒: 看资料时要先确认自己看的到底是开放平台路线,还是开源社区路线。
模型家族更偏行业和企业方案感

百川

百川给人的典型印象是中文和行业场景积累较深,适合在医疗、金融等专业场景里作为候选方案评估。

Baichuan4Baichuan M3行业路线
强在哪
  • - 行业方案属性强。
  • - 垂直场景存在感高。
  • - 适合做企业级对比评估。
适合谁
  • - 行业方案评估
  • - 垂直选型
  • - 企业级场景
选型提醒: 先确认你要的是通用 API,还是行业定制路线。

国外主流大模型家族

如果你更关注全球生态、Agent、工具调用和复杂工作流,再看这一组。

模型家族通用能力、代码和 Agent 生态都很成熟

OpenAI

OpenAI 的强项不只在模型本身,还在完整的工具调用、Responses API、SDK、文档和工程经验积累。

GPT-5.2GPT-4.1gpt-oss
强在哪
  • - 通用能力强。
  • - 代码和工具调用生态成熟。
  • - 适合复杂工作流和 Agent 产品。
适合谁
  • - 旗舰通用模型
  • - 代码和 Agent
  • - 复杂工作流
选型提醒: 对国内新手来说,网络、账号和支付门槛通常高于国内平台。
模型家族长文写作、代码理解和文档分析一直很强

Anthropic / Claude

Claude 给人的稳定印象是能写、能讲、代码理解好,特别适合需要高可读输出的场景。

Claude Opus 4.1Claude Sonnet 4Claude Haiku 3.5
强在哪
  • - 长文写作强。
  • - 代码审阅和解释体验好。
  • - 文档整理能力突出。
适合谁
  • - 内容生产
  • - 代码评审
  • - 文档与知识工作
选型提醒: 国内直连和支付门槛通常不低,更适合已经熟悉海外平台的人。
模型家族超长上下文和原生多模态是最大看点

Google Gemini

Gemini 适合把文本、图片、音频、视频、PDF 放到同一个模型体系里看,长上下文和多模态是它的核心竞争力。

Gemini 2.5 ProGemini 2.5 Flash
强在哪
  • - 超长上下文。
  • - 多模态原生整合强。
  • - 和 Google 工具链协同自然。
适合谁
  • - 超长文档
  • - 多模态理解
  • - 搜索和办公结合
选型提醒: 版本更新快,接入前要先分清 stable 和 preview。
模型家族更有互联网信息感和鲜明风格

xAI / Grok

Grok 适合强调实时信息感、长上下文和鲜明表达风格的产品,不太像传统企业助手路线。

Grok 4长上下文 API
强在哪
  • - 上下文容量大。
  • - 信息感和风格感强。
  • - 适合人格化产品体验。
适合谁
  • - 互联网信息类应用
  • - 长上下文分析
  • - 风格化产品
选型提醒: 国内可用性、合规和稳定接入要提前评估,不建议零基础用户作为第一站。
模型家族欧洲路线代表,开源权重和 API 并行

Mistral

Mistral 适合既看云 API,也关心 open-weight、自部署和轻量部署选择的团队。

Mistral LargeMistral MediumCodestral
强在哪
  • - 开源权重和 API 双线并行。
  • - 代码方向有特色。
  • - 适合更强调可控性的团队。
适合谁
  • - 代码助手
  • - 自部署评估
  • - 开放权重路线
选型提醒: 先分清开源权重模型和托管 API 模型,不是同一回事。
模型家族企业 RAG、检索增强和多语言场景很实用

Cohere

Cohere 在中文社区讨论度不一定最高,但在企业知识库、检索增强和多语言问答里很有存在感。

Command ACommand RAya
强在哪
  • - 企业 RAG 能力实用。
  • - 多语言路线清楚。
  • - 适合知识库型产品。
适合谁
  • - 知识库问答
  • - 多语言产品
  • - 检索增强助手
选型提醒: 中文资料相对少一些,上手前最好先看官方文档和示例。
模型家族开源生态影响力极大,自部署绕不开

Meta Llama

Llama 的价值更多体现在开源生态、社区工具和自部署路线,而不是“官方托管 API 第一选择”。

Llama 开源家族社区衍生代码模型
强在哪
  • - 开源生态大。
  • - 适合微调和私有化。
  • - 第三方平台兼容路线多。
适合谁
  • - 自部署和私有化
  • - 微调实验
  • - 开源路线研究
选型提醒: 不同版本许可和商业规则差异很大,别把社区版本和官方路线混在一起。
模型家族AWS / Bedrock 体系里的企业上云路线

Amazon Nova

如果你的应用本来就在 AWS 或 Bedrock 体系里,Amazon Nova 会是一条很自然的上云路线。

Nova ProNova LiteNova Canvas
强在哪
  • - 和 AWS 协同自然。
  • - 文本、多模态和内容生成路线完整。
  • - 适合企业上云治理。
适合谁
  • - AWS 团队
  • - 企业上云
  • - 内容生成产品
选型提醒: 如果你不在 AWS 体系里,起步复杂度通常会更高。

如果你还是拿不准,就按这个顺序走

别让选型把自己卡住,先让系统跑起来更重要。

第一步

先选最容易跑通的

如果你是第一次接龙虾机器人,优先选 DeepSeek、通义千问或 GLM。先把全链路跑通,再谈更高级的模型。

第二步

按任务类型再升级

长文档去看 Kimi、Gemini、Claude;代码和 Agent 去看 OpenAI、Claude、DeepSeek、Qwen Coder。

第三步

最后再看长期路线

当你已经确定会长期做产品,再去看云生态、治理能力、是否自部署、是否要语音视频和实时互动。