📖 本章预览
本章为预览版本,展示部分核心内容。完整内容包含详细源码解析、实战代码和面试要点,加入知识星球即可解锁全部章节。
第1章 大模型时代的开发者生存指南
1.1 大语言模型核心概念
1.1.1 什么是大语言模型(LLM)
大语言模型本质上是一个"概率预测器"——给定一段文本,它预测下一个最可能出现的 Token。通过海量文本训练,模型学会了语言的统计规律,从而能够生成连贯、有意义的文本。
核心认知:
- LLM 不是"理解"语言,而是学会了语言的统计模式
- 它的能力边界取决于训练数据的质量和规模
- 同一个问题,不同的提问方式会得到不同质量的回答
1.1.2 Token:LLM 的最小处理单元
LLM 不是按"字"或"词"处理文本的,而是按 Token。Token 是模型词表中的最小单元。
- 英文中,一个单词通常是 1~2 个 Token("hello" = 1 Token,"unbelievable" = 3 Token)
- 中文中,一个汉字通常是 1~2 个 Token
- Token 数量直接影响:调用成本(按 Token 计费)、上下文长度限制、响应速度
示例:
输入文本:"Spring AI 是一个很好的框架"
Token 化后:["Spring", " AI", " 是", "一个", "很好", "的", "框架"]
Token 数量:约 7~10 个(取决于具体模型的分词器)
1.1.3 关键参数
Temperature(温度)
- 控制输出的随机性,范围 0~2
- temperature=0:输出最确定的结果,适合事实性问答、代码生成
- temperature=0.7:平衡创造性和准确性,适合日常对话
- temperature=1.5+:高度随机,适合创意写作、头脑风暴
- 知识库场景建议 0.1,代码生成建议 0~0.3
Top-P(核采样)
- 从概率最高的 Token 中选择,累计概率达到 P 时停止
- top_p=0.1:只从最可能的少数 Token 中选,输出保守
- top_p=0.9:从较大范围中选,输出多样
- 通常 temperature 和 top_p 二选一调整,不建议同时调
Max Tokens
- 限制模型单次回复的最大 Token 数
- 不是越大越好——太大浪费成本,太小可能截断回答
- 一般对话设 512
1024,长文生成设 20484096
Stop Sequences
- 告诉模型遇到特定字符串时停止生成
- 常用于控制输出格式,如遇到
\n\n或---时停止
1.2 主流大模型对比
1.2.1 模型选型指南
| 模型 | 厂商 | 特点 | 适用场景 | 部署方式 |
|---|---|---|---|---|
| GPT-4o | OpenAI | 综合能力最强,多模态 | 复杂推理、代码生成 | API 调用 |
| 通义千问 (Qwen) | 阿里云 | 中文能力强,生态完善 | 国内企业应用首选 | API / 私有化 |
| DeepSeek | DeepSeek | 性价比高,推理能力强 | 代码、数学推理 | API / 开源部署 |
| Ollama 本地模型 | 社区 | 完全本地,数据不出域 | 隐私敏感场景 | 本地部署 |
| GLM-4 | 智谱 | 中文理解好 | 中文对话、文本处理 | API 调用 |
| Moonshot (Kimi) | 月之暗面 | 超长上下文(200K) | 长文档处理 | API 调用 |
1.2.2 选型决策树
需要处理敏感数据?
├── 是 → 数据能否出域?
│ ├── 否 → Ollama 本地部署(Qwen2、Llama3)
│ └── 是 → 阿里云通义千问(国内合规)
└── 否 → 预算充足?
├── 是 → GPT-4o(综合最强)
└── 否 → DeepSeek / 通义千问(性价比高)
1.3 AI 应用开发范式演进
1.3.1 三代开发范式
第一代:API 直调
直接用 HTTP 客户端调用模型 API,最原始但最灵活。
// 第一代:直接用 RestTemplate 调用 OpenAI API
public String callOpenAiDirectly(String question) {
RestTemplate restTemplate = new RestTemplate();
HttpHeaders headers = new HttpHeaders();
headers.setBearerAuth("sk-your-api-key");
headers.setContentType(MediaType.APPLICATION_JSON);
// 手动拼装请求体
String requestBody = """
🔒 解锁完整内容
本章剩余内容需要解锁后查看
以上仅为本章部分预览内容,完整内容包含更多深度源码解析、实战代码和面试要点。
加入知识星球你将获得:
- ✅ 全部 26 章完整内容 + 持续更新
- ✅ 配套源码 + 实战项目
- ✅ 一对一答疑 + 面试辅导
- ✅ 简历优化 + 内推机会
📚 本章完整目录
以下为本章完整目录结构,加入知识星球即可解锁全部内容。