跳到主要内容
📖 本章预览

本章为预览版本,展示部分核心内容。完整内容包含详细源码解析、实战代码和面试要点,加入知识星球即可解锁全部章节。

第1章 大模型时代的开发者生存指南

1.1 大语言模型核心概念

1.1.1 什么是大语言模型(LLM)

大语言模型本质上是一个"概率预测器"——给定一段文本,它预测下一个最可能出现的 Token。通过海量文本训练,模型学会了语言的统计规律,从而能够生成连贯、有意义的文本。

核心认知:

  • LLM 不是"理解"语言,而是学会了语言的统计模式
  • 它的能力边界取决于训练数据的质量和规模
  • 同一个问题,不同的提问方式会得到不同质量的回答

1.1.2 Token:LLM 的最小处理单元

LLM 不是按"字"或"词"处理文本的,而是按 Token。Token 是模型词表中的最小单元。

  • 英文中,一个单词通常是 1~2 个 Token("hello" = 1 Token,"unbelievable" = 3 Token)
  • 中文中,一个汉字通常是 1~2 个 Token
  • Token 数量直接影响:调用成本(按 Token 计费)、上下文长度限制、响应速度
示例:
输入文本:"Spring AI 是一个很好的框架"
Token 化后:["Spring", " AI", " 是", "一个", "很好", "的", "框架"]
Token 数量:约 7~10 个(取决于具体模型的分词器)

1.1.3 关键参数

Temperature(温度)

  • 控制输出的随机性,范围 0~2
  • temperature=0:输出最确定的结果,适合事实性问答、代码生成
  • temperature=0.7:平衡创造性和准确性,适合日常对话
  • temperature=1.5+:高度随机,适合创意写作、头脑风暴
  • 知识库场景建议 0.1,代码生成建议 0~0.3

Top-P(核采样)

  • 从概率最高的 Token 中选择,累计概率达到 P 时停止
  • top_p=0.1:只从最可能的少数 Token 中选,输出保守
  • top_p=0.9:从较大范围中选,输出多样
  • 通常 temperature 和 top_p 二选一调整,不建议同时调

Max Tokens

  • 限制模型单次回复的最大 Token 数
  • 不是越大越好——太大浪费成本,太小可能截断回答
  • 一般对话设 5121024,长文生成设 20484096

Stop Sequences

  • 告诉模型遇到特定字符串时停止生成
  • 常用于控制输出格式,如遇到 \n\n--- 时停止

1.2 主流大模型对比

1.2.1 模型选型指南

模型厂商特点适用场景部署方式
GPT-4oOpenAI综合能力最强,多模态复杂推理、代码生成API 调用
通义千问 (Qwen)阿里云中文能力强,生态完善国内企业应用首选API / 私有化
DeepSeekDeepSeek性价比高,推理能力强代码、数学推理API / 开源部署
Ollama 本地模型社区完全本地,数据不出域隐私敏感场景本地部署
GLM-4智谱中文理解好中文对话、文本处理API 调用
Moonshot (Kimi)月之暗面超长上下文(200K)长文档处理API 调用

1.2.2 选型决策树

需要处理敏感数据?
├── 是 → 数据能否出域?
│ ├── 否 → Ollama 本地部署(Qwen2、Llama3)
│ └── 是 → 阿里云通义千问(国内合规)
└── 否 → 预算充足?
├── 是 → GPT-4o(综合最强)
└── 否 → DeepSeek / 通义千问(性价比高)

1.3 AI 应用开发范式演进

1.3.1 三代开发范式

第一代:API 直调

直接用 HTTP 客户端调用模型 API,最原始但最灵活。

// 第一代:直接用 RestTemplate 调用 OpenAI API
public String callOpenAiDirectly(String question) {
RestTemplate restTemplate = new RestTemplate();

HttpHeaders headers = new HttpHeaders();
headers.setBearerAuth("sk-your-api-key");
headers.setContentType(MediaType.APPLICATION_JSON);

// 手动拼装请求体
String requestBody = """


🔒 解锁完整内容

本章剩余内容需要解锁后查看

以上仅为本章部分预览内容,完整内容包含更多深度源码解析、实战代码和面试要点。

加入知识星球你将获得:

  • ✅ 全部 26 章完整内容 + 持续更新
  • ✅ 配套源码 + 实战项目
  • ✅ 一对一答疑 + 面试辅导
  • ✅ 简历优化 + 内推机会

📚 本章完整目录

以下为本章完整目录结构,加入知识星球即可解锁全部内容。

1.3.2 为什么需要 Spring AI