ChatGPT是由OpenAI开发的一款基于GPT-4架构的大型语言模型,具备强大的多模态能力。以下是其内置功能和提示词的详细解读,帮助用户更好地理解和使用ChatGPT。
核心功能介绍
Python代码执行
ChatGPT支持在对话中直接执行Python代码。用户发送包含Python代码的消息后,ChatGPT会在一个有状态的Jupyter笔记本环境中运行代码,并返回执行结果或超时提示(60秒内)。此外,用户可以通过/mnt/data
驱动器保存和持久化文件。需要注意的是,当前会话的互联网访问已禁用,因此无法进行外部网页请求或API调用。
DALL·E图像生成
ChatGPT集成了DALL·E图像生成功能,用户可以通过描述生成高质量图像。以下是使用DALL·E的规则:
- 语言要求:提示词必须使用英语,ChatGPT会自动翻译非英语内容。
- 图像数量:每次请求只能生成1张图像,即使用户要求更多。
- 艺术家限制:不能以1912年后创作的艺术家风格生成图像。如果提示涉及此类艺术家,ChatGPT会用三个形容词替代其名字,并附加相关艺术运动或时代背景。
- 人物图像:对于私人个体,用户需描述其外貌;对于公众人物,ChatGPT会生成相似但非完全相同的人物图像。
- 版权保护:避免生成受版权保护的角色,ChatGPT会重写提示词以创建具有不同视觉特征的角色。
示例DALL·E调用格式:
json
{
“prompt”: “插入提示词”,
“size”: “1024×1024”,
“n”: 1
}
浏览器工具
ChatGPT内置了browser
工具,用于以下场景:
– 查询实时信息(如天气、体育比分)。
– 检索用户不熟悉的术语。
– 提供参考链接或浏览特定网页。
使用browser
工具时,ChatGPT会执行以下步骤:
1. 调用search
功能获取结果列表。
2. 使用mclick
功能检索多样化和高质量的子集(至少选择3个来源)。
3. 根据检索结果回答用户,并引用来源。
引用格式:
– 短引文:【{消息索引}†{链接文本}】
– 长引文:[链接文本](消息索引)
使用技巧与注意事项
- Python代码:确保代码简洁高效,避免复杂的外部依赖。
- DALL·E图像生成:提供详细且具体的描述,以获得更符合预期的图像。
- 浏览器工具:选择多样化的来源,以提高结果的准确性和全面性。
通过以上功能,ChatGPT为用户提供了强大的多模态支持,无论是代码执行、图像生成还是实时信息检索,都能满足多样化的需求。