来源:Anthropic 官方文档
翻译:Claude
校对:ALLinLLM
翻译进度:31%
1 介绍
1.1 开始使用 Claude
什么是 Claude
Claude 是由 Anthropic 开发的大型语言模型(LLM)。它经过训练,能够以会话形式提供帮助。
与 Claude 交互的方式有多种:
- 网页:通过 Anthropic 的控制台,您可以使用聊天界面与 Claude 对话。
- API:将 Claude 集成到您的产品中,为客户提供服务。
无论是哪种方式,与 Claude 的交互方式基本相同。这使得您可以先在网页控制台中尝试不同的提示方式,然后将其应用到 API 中。
获取 Claude 访问权限
Anthropic 正在逐步推出 Claude,以确保其安全性和可扩展性。我们正与选定的合作伙伴合作,在其产品中推出 Claude。如果您有兴趣成为合作伙伴,可以提交申请。请注意,由于申请量较大,回复可能需要一些时间。
如果您已经在 Slack 等平台上与 Claude 交互,并希望切换到 API 访问,您需要分别申请不同产品的访问权限。
与 Claude 的第一次聊天
Claude 的功能丰富,但其响应效果取决于您提问的方式。以下是一些建议,帮助您在初次交互时获得更好的体验。
像与外包员工交谈
将 Claude 视为一名外包员工,而不是简单的文本补全工具。例如:
写一篇专家级的激光光学技术摘要。
Claude“记住”整个线程
在 Slack 或网页界面中,Claude 可以看到您在当前线程中的所有内容。但它无法记住其他线程中的对话。
需要记住的限制
- Claude 正在“扮演”一个有帮助的助手角色,但有时会误报自己的能力。
- 在复杂算术和推理任务中,Claude 可能会出现错误。
- Claude 有时会编造信息或细节,尤其是在回答问题时。
- 虽然 Claude 了解现实世界的知识,但它无法访问互联网。
- Claude 的训练数据可能早于 2 年前,因此不知道当前事件或日期。
- Claude 无法在现实世界中采取行动或查阅信息,但可以提供建议。
术语词典
以下是与语言模型相关的一些关键概念:
上下文窗口
“上下文窗口”是指语言模型在生成文本时可以回顾和参考的文本量。对于 Claude,上下文窗口包含单个线程中的所有内容。
微调
微调是指使用额外数据进一步训练预训练语言模型的过程。Claude 已经经过微调,成为一款有用的助手。
HHH
HHH 代表 Anthropic 的目标:
– 有帮助:尽力完成任务或回答问题。
– 诚实:提供准确信息,避免虚构。
– 无害:避免冒犯或歧视,并礼貌拒绝危险请求。
LLM
大型语言模型(LLM)是具有大量参数的 AI 模型,能够执行多种任务。Claude 是基于 LLM 的会话助手。
RLHF
人工反馈强化学习(RLHF)是一种通过人类反馈调整模型行为的方法。Claude 已经通过 RLHF 训练成为一款有用的助手。
温度
温度是控制模型生成文本随机性的参数。较高的温度会生成更有创造性的文本,而较低的温度会生成更保守的文本。
Token
Token 是语言模型的最小单位,可以对应单词、字符或字节。对于 Claude,平均每个 token 约 3.5 个字符。
2 提示词(Prompt)设计
2.1 设计提示词
Claude 经过训练成为一名有帮助的助手。您可以使用标准英语指示它。将 Claude 想象成一名新雇佣的承包商,它没有任何上下文信息,因此需要非常具体的指令。
提示词
您给 Claude 的文本旨在引发相关响应。提示通常采取问题或指令的形式。例如:
人类:为什么天空是蓝色的?
助手:
通过 API 发送的提示必须包含 人类:
和 助手:
作为说话人的信号。
响应
Claude 的响应称为“响应”。例如,关于天空为什么是蓝色的解释。
“把内容喂到 Claude 的嘴里”
通过 人类
/ 助手:
提示样式,您可以让 Claude 持续对话并记住上下文。例如:
人类:请选择一个随机水果。
助手:这里是我为您随机选择的水果:番石榴。
人类:这种水果的颜色是什么?
助手:
提示长度
Claude 的上下文窗口当前为 6500 个单词/8000 个 token/28000 个 Unicode 字符。超出此限制时,Claude 可能会返回无连贯性的响应。
2.2 避免歧义
与 Claude 交谈时,确保提示词明确、具体。例如:
反例:纽约有多大?
正例:相比其他州,纽约州的面积和人口有多大?
提供示例
在提示中包含示例可以提高准确性。例如:
人类:想一个护士的有趣集体名词。
助手:
描述语调
通过指示 Claude 以特定语调行事,您可以使其在不同的角色中发挥作用。例如:
人类:以数学老师的身份行事。
助手:好的,我会是一个数学老师!
人类:毕达哥拉斯定理是什么?
助手:
提前填写响应内容
通过自己开始句子,您可以引导 Claude 快速回答问题。例如:
人类:给我词“尘埃”的 5 个同义词。
助手:以下是动词“尘埃”的 5 个同义词:
使用 XML 标记
XML 标记可以帮助定义提示和响应的结构。例如:
人类:从以下文章中提取引文。
助手:以下是相关引用:
指定输出长度
如果您想要特定长度的响应,请在提示中说明。例如:
人类:请告诉我关于乔治·华盛顿的信息,但限于 30 个单词。
助手:以下是乔治·华盛顿的 30 个单词描述:
设置期望
如果任务可能失败,请在提示中说明。例如:
人类:我正在查看文件,可能不包含相关信息。请告诉我文件是否包含答案。
助手:好的,我明白。
2.3 复杂任务
当任务复杂时,您可以将其分解为子任务。例如:
人类:请按以下步骤操作:
1. 编写一段关于工蜂如何维护巢穴的段落。
2. 将“蜜蜂”替换为德语单词。
助手:
检查 Claude 是否理解
通过询问 Claude 是否理解提示,您可以确保任务顺利进行。例如:
人类:您明白说明吗?
助手:是的,我理解。
一步一步地思考
通过明确告诉 Claude 一步一步地思考,可以显著改善其推理能力。例如:
人类:我有两只宠物猫,其中一只少了一条腿。总共,我的猫有几条腿?
助手:我可以一步一步地思考吗?
人类:是的,请这样做。
助手:
2.4 迭代式地补充提示词
通过使用 Claude 的响应,您可以提高后续提示的可靠性。例如:
人类:这里有一个句子:
您的答案是什么?
助手:输入句子包含单词“苹果”两次。因此,我的答案是 [2]。