促进 RAG 成功实施的快速工程模式

RAG（红绿灯）一直是幕后的制胜法宝，它赋能众多人工智能驱动的应用，使其能够跨越静态知识与动态实时信息之间的鸿沟。然而，要获得精准、相关且高价值的响应，既是一门科学，也是一门艺术。本文将指导您如何运用快速工程模式，使 RAG 的任何实现都更加高效。

为什么在 RAG 中及时的工程设计至关重要

现在，想象一下，你向人工智能助手询问今天的股市走势，结果它却提供了十年前一本财经书籍中的信息。这就是当你的指令不清晰、不具体或结构不合理时会发生的情况。

RAG从外部获取信息并构建基于信息的响应，但其有效性很大程度上取决于提示信息的设置方式。结构良好且定义清晰的提示信息可确保以下几点：

高检索准确率
减少幻觉和错误信息
更具情境感知能力的回应

先决条件

在深入探索之前，应该具备以下条件：

对大型语言模型（LLM）的高级理解
对 RAG 架构的理解
需要一些Python编程经验（我们将编写一些代码）。
幽默感——相信我，它很有帮助。

1. 直接检索模式

“只检索，不猜测。”

对于需要事实准确性的问题，强制模型依赖检索到的文档可以最大限度地减少幻觉。

例子：

prompt = "Using only the provided retrieved documents, answer the following question. Do not add any external knowledge."

其原理：

答案基于检索到的数据
减少猜测或错误回应

陷阱：

如果限制过多，人工智能会变得过于谨慎，出现很多“我不知道”的回答。

2. 思维链（CoT）提示

“像侦探一样思考。”

对于复杂的推理，引导人工智能完成逻辑步骤的过程可以提高响应质量。

例子：

prompt = "Break down the following problem into logical steps and solve it step by step using the retrieved data.""

其原理：

提高推理能力和透明度
提高回答的可解释性

陷阱：

增加响应时间和令牌使用量

3. 上下文丰富模式

“提供更多背景信息，减少错误。”

提示中提供更多上下文信息有助于获得更准确的回答。

例子：

context = "You are a cybersecurity expert analyzing a recent data breach."
prompt = f"{context} Based on the retrieved documents, explain the breach's impact and potential solutions."

其原理：

根据特定领域的需求调整回复
减少人工智能输出中的歧义

陷阱：

过多的背景信息可能会使模型不堪重负。

4. 指令调音模式

“要表达清楚，要直截了当。”

当指令精确且结构化时，LLM 的性能会更好。

例子：

prompt = "Summarize the following document in three bullet points, each under 20 words."

为什么这种方法有效：

引导模型生成结构化输出
避免冗长赘述

陷阱：

僵化的格式可能会限制细致入微的回应。

5. 基于角色的提示

“针对目标群体提供个性化回复。 ”

如果您的 RAG 模型服务于不同的最终用户，例如新手与专家，那么响应个性化将丰富参与度。

例子：

user_type = "Beginner"
prompt = f"Explain blockchain technology as if I were a {user_type}, using simple language and real-world examples."

其原理：

提高可及性
增强个性化

常见错误：

过度简化可能会遗漏对专家而言重要的信息。

6. 错误处理模式

“如果人工智能出错怎么办？ ”

提示信息必须包含对结果的反映，以便人工智能能够标记任何不确定因素。

例子：

prompt = "If your response contains conflicting information, state your confidence level and suggest areas for further research."

其原理：

更透明的回应
减少虚假信息风险

陷阱：

即使答案正确，人工智能也可能总是给出置信度较低的答案。

7. 多遍查询优化

“反复迭代，直到答案完美为止。 ”

这种方法不是提供一次性响应，而是通过迭代查询来提高准确性。

例子：

prompt = "Generate an initial answer, then refine it based on retrieved documents to improve accuracy."

其原理：

帮助人工智能自我纠正错误
提高事实一致性

陷阱：

需要更多处理时间

8. 结合少量示例的混合提示法

“用行动证明，而非空谈。 ”

少量样本学习通过实例强化结果的一致性。

例子：

prompt = "Here are two examples of well-structured financial reports. Follow this pattern when summarizing the retrieved data."

其原理：

给出参考结构
培养连贯性和质量

陷阱：

需要精选的策展案例

歌曲推荐中应用 RAG 算法

import torch
from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration

# Load the RAG model, tokenizer, and retriever
model_name = "facebook/rag-sequence-nq"
tokenizer = RagTokenizer.from_pretrained(model_name)
retriever = RagRetriever.from_pretrained(model_name)
model = RagSequenceForGeneration.from_pretrained(model_name, retriever=retriever)

# Define user input: Mood for song recommendation
user_mood = "I'm feeling happy and energetic. Recommend some songs to match my vibe."

# Tokenize the query
input_ids = tokenizer(user_mood, return_tensors="pt").input_ids

# Generate a response using RAG
with torch.no_grad():
 output_ids = model.generate(input_ids, max_length=100, num_return_sequences=1)

# Decode and print the response
recommendation = tokenizer.batch_decode(output_ids, skip_special_tokens=True)
print("🎵 Song Recommendations:", recommendation[0])

其他注意事项

您还需要考虑一些事项，即处理长查询、优化检索质量以及评估和改进提示。

处理长查询

把复杂的查询拆分成子查询。
在将输入数据输入模型之前，先对其进行汇总。
根据关键词相关性对检索结果进行排序。

优化检索质量

利用嵌入实现更优的相似性搜索
在特定领域任务上对检索模型进行微调
混合搜索：BM 25 + 嵌入的实验。

评估和改进提示语

可以通过人工反馈来监控响应质量。
对提示进行A/B测试以评估其有效性
需要根据各种指标对提示进行迭代修改。

结论：如何掌握 RAG 中的提示工程

掌握RAG不仅需要强大的语言学习模型 (LLM)，还需要精准地设计提示语。正确的模式能够显著提高响应的准确性、上下文相关性和速度。无论是金融、医疗保健、网络安全还是其他任何领域，结构化的提示语设计都能确保您的 AI 提供以价值为导向的洞察。

最后一点建议：迭代。优秀的提示信息会不断演进，就像最优秀的AI应用一样。今天精心设计的提示信息，明天可能就需要根据用例的扩展和AI能力的提升进行调整。保持灵活，不断尝试和改进，才能达到最佳性能。

参考

Lewis, P. 等人。“面向知识密集型 NLP 任务的检索增强生成。” NeurIPS，2020 年。
Brown, T. 等人。“语言模型是少样本学习器。” NeurIPS，2020。
OpenAI。“GPT-4 技术报告。” 2023 年。
Google AI。“理解LLM的提示工程。”博客文章，2023年。
Borgeaud, S. 等人。“通过从数万亿个词元中检索来改进语言模型。”DeepMind，2022 年。
Radford, A. 等人。“从自然语言监督中学习可迁移的视觉模型。” OpenAI，2021 年。

文章来源：https://dev.to/shittu_olumide_/prompt-engineering-patterns-for-successful-rag-implementations-2m2e

分享

促进 RAG 成功实施的快速工程模式

促进 RAG 成功实施的快速工程模式

为什么在 RAG 中及时的工程设计至关重要

先决条件

1. 直接检索模式

其原理：

陷阱：

2. 思维链（CoT）提示

其原理：

陷阱：

3. 上下文丰富模式

其原理：

陷阱：

4. 指令调音模式

为什么这种方法有效：

陷阱：

5. 基于角色的提示

其原理：

常见错误：

6. 错误处理模式

其原理：

陷阱：

7. 多遍查询优化

其原理：

陷阱：

8. 结合少量示例的混合提示法

其原理：

陷阱：

歌曲推荐中应用 RAG 算法

其他注意事项

处理长查询

优化检索质量

评估和改进提示语

结论：如何掌握 RAG 中的提示工程

参考