【2】提示词规范
1. 主流模型差异
说明:用 ✅ 推荐 / ☑️ 可用 / ⚠️ 不建议/有限 / — 无明确结论。表内为厂商文档与权威指南能支撑的结论;带“*”的格子表示特别注意是“推理模型”场景差异。
| 模型 | System 提示词 | Few‑shot 示例 | 显式 CoT 提示 | 角色设定放在 system? | 用 XML 分隔 | 用 Markdown 分隔 | 三引号/### 分隔 |
|---|---|---|---|---|---|---|---|
| GPT‑4.1 / 4o | ✅(developer/system 明确支持) | ☑️(视任务有效) | ☑️(普通模型可用;推理专模另当别论) | ☑️ | ☑️(可用,非特长) | ✅ | ✅ |
| Claude 3.5 / 3.7 / 4.x | ✅(官方推荐) | ☑️ | ☑️/✅*(3.7+ 提供 Extended Thinking 模式) | ✅(强烈建议) | ✅(官方强推) | ✅ | ✅ |
| Gemini 2.5 Pro | ✅(System Instructions) | ☑️(官方最佳实践之一) | ☑️(可用) | ✅ | ☑️(可用;更推荐 JSON/Schema 出参) | ✅ | ✅ |
| Qwen3(如 235B‑A22B/Max) | ☑️(模板默认含 system) | ☑️ | ☑️(支持 |
✅ | ☑️ | ✅ | ✅ |
| Doubao / Seed‑1.6 | ☑️(通用 LLM 写法) | ☑️ | ☑️(按需) | ☑️ | —(无官方偏好) | ✅ | ✅ |
| DeepSeek‑R1(推理) | ⚠️(官方建议不要) | ⚠️(官方建议不要) | ⚠️(不必显式 CoT 提示) | ⚠️(不要放 system) | ☑️(建议XML/Markdown分区) | ☑️ | ☑️ |
| DeepSeek‑V3(通用) | ☑️(社区与实践支持) | ☑️ | ☑️(按需;非 R1 那类“强推理模”) | ☑️ | ☑️ | ✅ | ✅ |
已验证项目:
- Claude官方明确推荐用 system 设定角色,并强烈推荐用 XML 标签分隔上下文/指令/示例。anthropic.mintlify.app+1
- DeepSeek‑R1(推理模型)官方/托管服务文档明确建议不要用 system、不要 few‑shot、不必显式 CoT 提示,并建议用 XML 或 Markdown清晰分隔结构。如果有要求进行明确要求(不准超过X秒,禁止XXX)Together.ai Docs
- Gemini 2.5 Pro官方文档明确支持/推荐 System Instructions与结构化输出(JSON Schema),Few‑shot 与“角色设定”都在 Google 指南中被推荐作为常用策略。Google Cloud+2Googl
- OpenAI GPT‑4.1 / 4o官方文档明确支持 system / developer 指令、推荐结构化输出(JSON Schema 的 Structured Outputs),并给出使用分隔符(包含三引号/XML)的提示工程策略。platform.openai.com+2platform.openai.com+2
- Qwen3(如 235B‑A22B)开源模板显示默认带 system 模板/角色,并且支持“思考/非思考模式”切换(
… )。Hugging Face+2Hugging Face+2 - Doubao / Seed‑1.6官方资料确认模型系列与“自适应思考/AdaCoT、256K 上下文”等,但未给出“XML/Markdown/三引号优劣”的官方偏好——属于通用分隔手法。
2. 提示词结构差异
markdown或者xml的格式样式,按照输入、角色、步骤/任务、输出、要求四种方式。
2.1 markdown排版
可读性好,大多数模型支持。Claude不建议使用markdown
# 输入
XXXX
# 角色
你是一名资深商业分析师。
# 任务说明
根据以下主题和背景资料,撰写一份简短的分析报告。
1. XXX
2. XXX
3. XXX
# 输出
- 使用正式书面语气。
- 内容需涵盖以下3个部分:
1. 市场背景分析
2. 关键数据解读
3. 结论和建议
- 每个部分不超过150字。
- 全文使用中文。
2.2 xml标签模式
代码格式,大多数模型都支持
<输入>
用户输入的文本信息
</输入>
<角色>
你是一个专业的故事专家和视频剪辑师,除非用户特别要求,否则你的回答语言应跟用户请求的语言保持一致。
</角色>
<任务>
<任务1>
XXXXX
</任务1>
</任务>
<输出>
<输出格式>
# 标题
故事的总结内容
</输出格式>
<输出要求>
1、扩写故事:请用纯文本的格式展示故事标题和全部故事内容。
2、故事脚本:请用表格的方式展示故事台词和画面描述。
3、文生图:展示文生图的图片,只展示图片,不展示和图片无关的内容。
4、图生视频:给到全部分段的视频链接。
5、故事配音:给到全部分段的音频链接。
6、视频配音:展示配音后全部分段的视频链接。
7、视频拼接:展示拼接后的长视频。
8、获取bgm:展示获取的bgm链接。
9、视频添加bgm:展示最终添加bgm的视频。
</输出要求>
<执行>
请在内部完成思考与推理,不要显式展示推理过程。
严格遵循<任务>、<输出>来处理用户请求。
</执行>
</输出>
2.3 模型格式不同
| 模型 | 非think模型 | think模型(COT) | agent框架 |
|---|---|---|---|
| 模型 | GPT4o, kimi-k2,qwen-235b,deepseek-V3/V3.1 | deepseek-R1,doubao-1.6-seed | REACT框架,MCP工具调用 |
| 特点 | 直接输出,大多数模型都是decoder模型,通过attention机制计算最后一个词向量,去预测下一个词语 提示词中所有的词语都是一次性并行计算QKV计算,但是由于decoder模型的因果掩码自注意力(Causal Masked Self-Attention),每个词只看前文,所有最好背景和角色在前面,限制词语在后面 |
在向量模型的基础上,增加了COT思维链。COT将think的过程作为动态的提示词增加到输入,缓解提示词的难度。 因为COT的产生,在提示词中加入提示词反思机制成为可能。在输出前加入自我反思提示词,让输出符合规范 |
通过MCP调用,使用模型的think- action方式,可以多次调用工具进行校正和反思,最终输出结果 |
| 优缺点 | 优点:速度快 缺点:需要更严格的结构化提示才能稳定格式(尤其不带隐式思考时)。 |
优点:内容丰富,指令遵循高 缺点:速度慢,成本更高(token 更多/时间更久)、有时会过度冗长(需用硬性输出规范抑制)。 |
优点:借助工具,输出幻觉更少 缺点:速度慢,需要工具接入与容错设计(超时/失败重试/回退策略)。 |
| 提示词风格 | 需要严格的提示词,无论是XML还是markdown,最好的格式是:<br># 角色<br>XXXX<br># 输入(如有)<br>XXX<br># 步骤<br>XXXX<br># 输出<br>XXX<br># 输出要求<br> |
在输出中增加反思格式,在最后增加质量自检 | 在任务中增加自检逻辑 |
3. 变量
大模型就像一个人一样,如何能给大模型讲明白要做什么事情,比如我们要指定输出某个格式,哪些内容是需要变得,哪些内容是不变的。打个比方,我想让大模型固定输出如下格式:
# 标题
论点1:XXXX
论点2:XXXX
那么问题来了,如果我想让大模型输出的内容论点x一直保留,但是XXXX是通过大模型总结出来的,我怎么能让大模型知道哪些内容是需要大模型总结,哪些内容不需要大模型总结呢。这里就涉及到变量,目前的变量有几种形式:
3.1 方括号格式
适用于变量较少(1~2个),文本长度较短,轻量prompt,优点是简单,缺点是如果文本中恰好也需要使用[]输出,会让模型输出异常
以下是文章内容,按如下格式输出,[占位符]所有内容基于文本内容生成:
```
# 这是不变的标题
[这里是长篇大论的文章内容,可以有很多段落和特殊字符...]
```
3.2 双括号
双括号很少会和其他文本格式冲突,但是有些双括号在agent内是变量,有可能会异常,比如智脑的agent平台就不支持
按如下格式输出,{{占位符}}所有内容基于会议内容智能提取:
```
## 📝 会议内容
### {{主议题一}}
- **{{子议题1}}**: {{提取要点说明}}
- **{{子议题2}}**: {{提取要点说明}}
```
3.3 XML
标签分隔,适用于变量较多,复杂且严谨场景,推荐使用,如果和[]冲突,里面变量可以用{{}}
文章内容包含在<article>和</article>标签之间。
<article>
这里是长篇大论的文章内容,可以有很多段落和特殊字符...
</article>
4 变量引用
当我们在提示词中已经定义了某些行为,那么我们可以在后续的提示词中引用这些行为或者变量。比如:
<输入>
用户的输入文本
</输入>
1. **整体分析**
- 通读全部发言,准确把握文本总体结构和主题变化。
- 根据实际讨论自然划分章节,明确每个主议题。
2. **标题**
- 每个章节需有独立的主议题标题(如:业务进展、技术路线),提取对应的标题。
4.1 markdown引用
那么我们在后面可以直接用双引号引用对应变量,表示标题是前面已经定义过的内容。比如:
请对**标题**进行内部解析,用于后续文本生成。
4.2 XML引用
如果是XML格式,可以直接引用XML标签:
分析<输入>文本本文发布于2025年11月03日01:04,已经过了56天,若内容或图片失效,请留言反馈 -
github大模型软件评测
1. 背景 互联网上有许多开源的大模型软件,每种软件都有其独特的功能和优缺点。我曾试用过许多大模型软件,但最终效果和具体内容都未能完全记住。因此,本文将主要记录我所了解和使用过的大模型软件。此外,文中...
2025/02/19
-
whisper.cpp安装
1. 背景 whisper是OpenAI官方发布的一款开源语音识别大模型,使用python实现。可以将语音信息转化为文本信息。其实也叫做ASR"自动语音识别”(Automatic Speech Rec...
2025/03/02
-
【1】COGVIDEO生成视频
1. 背景 cogvideoX是清华和清影同源的开源视频生成大模型,详情可以查看:CogvideoXhttps://modelscope.cn/models/ZhipuAI/CogVideoX-5b-...
2024/11/19
-
whisper.cpp测试与使用
whipser.cpp安装完毕后,加载了多个大模型,分别进行测试。 测试项目 下载模型命令: bash sh ./models/download-ggml-model.sh base 测试命令: 转化...
2025/04/21
求索空间
apostle9891
360视觉云
360智慧生活
gitea
导航
hoppscotch
暂无评论