【官方】Claude 大语言模型使用指南中文版

来源:Anthropic 官方文档
翻译:Claude
校对:ALLinLLM
翻译进度:31%


1 介绍

1.1 开始使用 Claude

什么是 Claude

Claude 是由 Anthropic 开发的大型语言模型(LLM)。它经过训练,能够以会话形式提供帮助。

与 Claude 交互的方式有多种:

  • 网页:通过 Anthropic 的控制台,您可以使用聊天界面与 Claude 对话。
  • API:将 Claude 集成到您的产品中,为客户提供服务。

无论是哪种方式,与 Claude 的交互方式基本相同。这使得您可以先在网页控制台中尝试不同的提示方式,然后将其应用到 API 中。

获取 Claude 访问权限

Anthropic 正在逐步推出 Claude,以确保其安全性和可扩展性。我们正与选定的合作伙伴合作,在其产品中推出 Claude。如果您有兴趣成为合作伙伴,可以提交申请。请注意,由于申请量较大,回复可能需要一些时间。

如果您已经在 Slack 等平台上与 Claude 交互,并希望切换到 API 访问,您需要分别申请不同产品的访问权限。

与 Claude 的第一次聊天

Claude 的功能丰富,但其响应效果取决于您提问的方式。以下是一些建议,帮助您在初次交互时获得更好的体验。

像与外包员工交谈

将 Claude 视为一名外包员工,而不是简单的文本补全工具。例如:

写一篇专家级的激光光学技术摘要。

Claude“记住”整个线程

在 Slack 或网页界面中,Claude 可以看到您在当前线程中的所有内容。但它无法记住其他线程中的对话。

需要记住的限制
  • Claude 正在“扮演”一个有帮助的助手角色,但有时会误报自己的能力。
  • 在复杂算术和推理任务中,Claude 可能会出现错误。
  • Claude 有时会编造信息或细节,尤其是在回答问题时。
  • 虽然 Claude 了解现实世界的知识,但它无法访问互联网。
  • Claude 的训练数据可能早于 2 年前,因此不知道当前事件或日期。
  • Claude 无法在现实世界中采取行动或查阅信息,但可以提供建议。

术语词典

以下是与语言模型相关的一些关键概念:

上下文窗口

“上下文窗口”是指语言模型在生成文本时可以回顾和参考的文本量。对于 Claude,上下文窗口包含单个线程中的所有内容。

微调

微调是指使用额外数据进一步训练预训练语言模型的过程。Claude 已经经过微调,成为一款有用的助手。

HHH

HHH 代表 Anthropic 的目标:
有帮助:尽力完成任务或回答问题。
诚实:提供准确信息,避免虚构。
无害:避免冒犯或歧视,并礼貌拒绝危险请求。

LLM

大型语言模型(LLM)是具有大量参数的 AI 模型,能够执行多种任务。Claude 是基于 LLM 的会话助手。

RLHF

人工反馈强化学习(RLHF)是一种通过人类反馈调整模型行为的方法。Claude 已经通过 RLHF 训练成为一款有用的助手。

温度

温度是控制模型生成文本随机性的参数。较高的温度会生成更有创造性的文本,而较低的温度会生成更保守的文本。

Token

Token 是语言模型的最小单位,可以对应单词、字符或字节。对于 Claude,平均每个 token 约 3.5 个字符。


2 提示词(Prompt)设计

2.1 设计提示词

Claude 经过训练成为一名有帮助的助手。您可以使用标准英语指示它。将 Claude 想象成一名新雇佣的承包商,它没有任何上下文信息,因此需要非常具体的指令。

提示词

您给 Claude 的文本旨在引发相关响应。提示通常采取问题或指令的形式。例如:

人类:为什么天空是蓝色的?
助手:

通过 API 发送的提示必须包含 人类:助手: 作为说话人的信号。

响应

Claude 的响应称为“响应”。例如,关于天空为什么是蓝色的解释。

“把内容喂到 Claude 的嘴里”

通过 人类/ 助手: 提示样式,您可以让 Claude 持续对话并记住上下文。例如:

人类:请选择一个随机水果。
助手:这里是我为您随机选择的水果:番石榴。
人类:这种水果的颜色是什么?
助手:

提示长度

Claude 的上下文窗口当前为 6500 个单词/8000 个 token/28000 个 Unicode 字符。超出此限制时,Claude 可能会返回无连贯性的响应。

2.2 避免歧义

与 Claude 交谈时,确保提示词明确、具体。例如:

反例:纽约有多大?
正例:相比其他州,纽约州的面积和人口有多大?

提供示例

在提示中包含示例可以提高准确性。例如:

人类:想一个护士的有趣集体名词。
助手:

描述语调

通过指示 Claude 以特定语调行事,您可以使其在不同的角色中发挥作用。例如:

人类:以数学老师的身份行事。
助手:好的,我会是一个数学老师!
人类:毕达哥拉斯定理是什么?
助手:

提前填写响应内容

通过自己开始句子,您可以引导 Claude 快速回答问题。例如:

人类:给我词“尘埃”的 5 个同义词。
助手:以下是动词“尘埃”的 5 个同义词:

使用 XML 标记

XML 标记可以帮助定义提示和响应的结构。例如:

人类:从以下文章中提取引文。

文章内容

助手:以下是相关引用:

指定输出长度

如果您想要特定长度的响应,请在提示中说明。例如:

人类:请告诉我关于乔治·华盛顿的信息,但限于 30 个单词。
助手:以下是乔治·华盛顿的 30 个单词描述:

设置期望

如果任务可能失败,请在提示中说明。例如:

人类:我正在查看文件,可能不包含相关信息。请告诉我文件是否包含答案。
助手:好的,我明白。

2.3 复杂任务

当任务复杂时,您可以将其分解为子任务。例如:

人类:请按以下步骤操作:
1. 编写一段关于工蜂如何维护巢穴的段落。
2. 将“蜜蜂”替换为德语单词。
助手:

检查 Claude 是否理解

通过询问 Claude 是否理解提示,您可以确保任务顺利进行。例如:

人类:您明白说明吗?
助手:是的,我理解。

一步一步地思考

通过明确告诉 Claude 一步一步地思考,可以显著改善其推理能力。例如:

人类:我有两只宠物猫,其中一只少了一条腿。总共,我的猫有几条腿?
助手:我可以一步一步地思考吗?
人类:是的,请这样做。
助手:

2.4 迭代式地补充提示词

通过使用 Claude 的响应,您可以提高后续提示的可靠性。例如:

人类:这里有一个句子:
我吃了一个苹果,然后我吃了另一个苹果。
您的答案是什么?
助手:输入句子包含单词“苹果”两次。因此,我的答案是 [2]。


👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年8月3日
下一篇 2025年8月3日

热门推荐