维护说明
本文为系列附录,长期维护。
收录规则:
- 只收录普通人会遇到、且影响选择或安全边界的内容
- 每个词不超过 250 字
- 发生产品变化时,优先更新事实,不重写系列主张
- 模型排名、价格、地区可用性、隐私政策等不稳定内容,写作前必须查官方来源
如发现内容过时,让 Codex 帮你查官方页面确认。
模型类
GPT(Generative Pre-trained Transformer)
OpenAI 开发的大语言模型,支撑 ChatGPT 和 Codex。最新版本为 GPT-4o 和 o1 系列。ChatGPT 网页版有免费层,API 按 Token 计费。
Claude
Anthropic 开发的大语言模型,以长上下文和安全对齐著称。Claude 3.5 Sonnet 是当前主力版本。支持 200K 上下文窗口,在复杂推理和代码任务上表现优秀。提供网页版(claude.ai)和 API。
Gemini
Google 开发的大语言模型,原生支持多模态(文字、图片、音频、视频)。Gemini 1.5 Pro 支持 100 万 Token 上下文。可以通过 Google AI Studio 和 API 访问。
DeepSeek
中国大模型公司 DeepSeek AI 开发,开源模型 DeepSeek Coder、DeepSeek Math 系列以高性价比著称。DeepSeek V3 和 R1 模型性能接近 GPT-4 和 Claude,但 API 定价明显更低。有网页版和 API。
Qwen(通义千问)
阿里巴巴开发的大语言模型,支持中文长上下文。多版本迭代,最新版为 Qwen 3。支持开源模型下载,也提供 API 调用。
Kimi(月之暗面)
中国公司月之暗面开发的大语言模型,以超长上下文著称(支持 20M Token)。Kimi 网页版和 App 可直接使用,有免费层。对中文用户友好。
文心一言(百度)
百度开发的大语言模型,通过文心一言网页版或百度智能云 API 使用。有免费层,付费版提供更高额度。
MiniMax
中国 AI 公司,主要产品为海螺AI(视频生成)和通用语言模型。提供文本、语音、视频、音乐多模态模型。API 付费使用。
能力类
上下文窗口(Context Window)
AI 单次能处理的最大文字量。窗口越大,一次能发给它的内容越多。例如 Claude 3.5 Sonnet 支持 200K Token,约等于 15 万汉字或 50 万英文字母。长文档任务需要检查工具的上下文限制。
多模态(Multimodal)
AI 能同时处理文字、图片、音频、视频中的一种或多种。例如能看图说话、能听语音转文字、能生成图片。能处理什么模态是选工具的重要维度。
联网搜索(Web Search / Grounded Search)
AI 能上网查询最新信息,不只依赖训练数据回答问题。联网搜索的结果可以附带来源链接,便于核实。并非所有 AI 工具都支持联网,使用前确认。
推理(Reasoning)
AI 在给出答案前进行内部推理和思考的能力。OpenAI o1 和 Claude 3.7 Sonnet 等推理模型在数学、编程、逻辑问题上有明显优势,但响应速度较慢。
记忆(Memory / Context Recall)
AI 在同一对话中记住之前内容的能力。大多数工具的”记忆”仅限于当前会话,关闭对话后忘记。跨会话记忆需要额外工具(如 Codex 的 MCP 记忆功能)。
工作方式类
Agent
AI 能自动拆解任务、执行多步操作的模式。例如”帮我把这篇稿子改好并发到网上”,Agent 会自己拆解步骤并依次执行,不需要人一步一步指挥。
工具调用(Tool Use / Function Calling)
AI 能调用外部工具——读文件、改文件、查天气、发邮件、运行代码。Codex 的核心能力就是工具调用,让它能在你的目录里工作。
MCP(Model Context Protocol)
Anthropic 提出的模型上下文协议,让 AI 能更标准地调用外部工具和数据源。例如让 Codex 连接到你的笔记工具、文件管理系统。比传统 API 集成更灵活。
API(Application Programming Interface)
两个软件之间传递指令的接口。普通人使用 AI API 时,主要是提供 API Key 让工具获得授权,按消耗的 Token 计费。
本地模型(Local Model)
在你自己的电脑上运行的 AI 模型,不需要联网。Llama、Qwen、DeepSeek 都有开源本地版本。适合对隐私有要求、不想付费、或需要自定义的场景。需要足够显卡(GPU)或用 CPU 降速运行。
成本类
Token
AI 处理文字时的最小计量单位。大概相当于一个汉字或几个英文字母。AI 按输入和输出的 Token 总数计费。1 Token ≈ 0.75 个英文单词 ≈ 1-2 个汉字。
订阅(Subscription)
每月固定费用,用量不限或有上限。ChatGPT Plus(20美元/月)、Claude Pro(20美元/月)、GitHub Copilot(4-10美元/月)均为订阅制。适合日常高频用户。
按量付费(Pay-as-You-Go / Token-based)
按实际消耗量计费,没有月度固定费用。适合用量不稳定的用户。OpenAI API、Claude API、Google AI Studio 均采用此模式。
免费额(Free Tier)
每个工具提供的免费使用量。通常每日或每月有限额,超出后需付费或等待重置。大多数主流工具都有免费额,适合测试和轻量使用。
安全类
幻觉(Hallucination)
AI 生成听起来合理但实际错误的内容。原因是训练目标让它”补全”它认为你可能想听的话,而不是保证事实准确。重要事实必须核实来源。
隐私政策(Privacy Policy)
工具服务商如何处理你发送的数据的政策。不同公司差异很大:有的明确不用训练数据、有的保留使用权、有的支持企业版数据隔离。使用前阅读隐私政策或让 Codex 帮你查官方说明。
训练数据(Training Data)
用来训练 AI 模型的数据。如果你不希望自己的数据影响 AI 的训练,选择明确”不使用用户数据训练”的工具。
API Key 管理
API Key 等于账号密码,一旦泄露他人可以完全控制你的账号。使用原则:不分享、不提交到公开代码库、不存在项目文件里、用环境变量存储。
工具入口类
CLI(Command-Line Interface)
命令行界面,在终端窗口里运行的工具。macOS 叫”终端”,Windows 叫”CMD”或”PowerShell”。CLI 能读本地文件、改目录、运行命令,是普通人用 AI 操作本地项目的最佳入口。
IDE(Integrated Development Environment)
集成开发环境,集代码编辑、文件浏览、终端、插件于一体的代码编辑器。VS Code、Cursor、Windsurf 都是 IDE。适合程序员或需要同时看文件列表和对话的用户。普通人用 Codex CLI 不一定需要 IDE。
MCP Server
Model Context Protocol 的服务端,让 AI 能连接到外部数据源和工具。例如 Codex 可以通过 MCP 连接到你的 Obsidian 笔记、文件系统或其他工具。比传统 API 更灵活、更标准化。
