AI Agents for Beginners笔记: 3.AI智能体设计原则
📅 2025-02-19 | 🖱️
关于构建AI智能系统,有许多不同的思考方式。由于在生成式AI设计中,模糊性是一种特性而非缺陷,因此工程师有时会难以确定从哪里开始。
《AI Agents for Beginners》制定了一套以人为中心的用户体验设计原则,旨在帮助开发者构建以客户为中心的智能体系统,以满足他们的业务需求。这些设计原则并不是一种规定性的架构,而是为定义和构建智能体体验的团队提供的起点。
一般来说,智能体系统应该:
- 扩展和增强人类能力(如头脑风暴、解决问题、自动化等)
- 弥补知识空白(例如帮助快速了解某一知识领域、翻译等)
- 促进并支持我们个人偏好的协作方式
- 让我们成为更好的自己(例如,作为生活教练/任务管理者,帮助我们学习情绪调节和正念技巧,建立韧性等)
智能体设计原则 #
Agent (Space) #
这是智能体运行的环境。这些原则指导我们如何设计智能体以参与物理和数字世界。
连接而非替代 - 帮助人们连接其他人、事件和可执行的知识,以促进协作和联系。
- 智能体帮助连接事件、知识和人。
- 智能体拉近人与人之间的距离。它们的设计目的不是替代或贬低人。
易于访问但适时隐形 - 智能体主要在后台运行,只在相关和适当的时候提醒我们。
- 智能体对授权用户来说在任何设备或平台上都易于发现和访问。
- 智能体支持多模态输入和输出(声音、语音、文本等)。
- 智能体可以根据对用户需求的感知,在前台和后台、主动和被动之间无缝切换。
- 智能体可能以隐形形式运行,但其后台处理路径以及与其他智能体的协作对用户来说是透明和可控的。
Agent (Time) #
这是智能体如何随时间运作。这些原则指导我们如何设计智能体在过去、现在和未来中进行交互。
过去:反思包含状态和背景的历史
- 智能体基于对事件、人物或状态之外更丰富的历史数据分析,提供更相关的结果。
- 智能体从过去事件创建连接,并主动反思记忆以应对当前情况。
现在:引导重于通知
- 智能体体现了与人交互的综合方法。当事件发生时,智能体超越静态通知或其他固定形式。智能体可以简化流程或动态生成提示,在适当时机引导用户注意力。
- 智能体基于情境环境、社会和文化变化来传递信息,并根据用户意图进行调整。
- 智能体的交互可以是渐进的,复杂度逐步演进/增长,从而长期赋能用户。
未来:适应和进化
- 智能体适应各种设备、平台和模态。
- 智能体适应用户行为、无障碍需求,并可自由定制。
- 智能体通过持续的用户交互来塑造和进化。
Agent (Core) #
这些是智能体设计核心中的关键要素。
- 接纳不确定性但建立信任
- 智能体的一定程度不确定性是可预期的。不确定性是智能体设计的关键要素。
- 信任和透明度是智能体设计的基础层。
- 人类掌控智能体的开启/关闭,且智能体状态始终清晰可见。
实施智能体设计原则的指导方针 #
当运用这些设计原则时,请遵循以下指导方针:
透明度:告知用户 AI 的参与情况、其运作方式(包括过去的行为),以及如何提供反馈和修改系统。
控制权:使用户能够进行定制、指定偏好和个性化设置,并对系统及其属性保持控制(包括遗忘的能力)。
一致性:致力于在各种设备和终端上提供一致的多模态体验。尽可能使用熟悉的 UI/UX 元素(例如,使用麦克风图标表示语音交互),并尽可能减轻用户的认知负担(例如,力求简洁的回应、视觉辅助和"了解更多"内容)。
如何运用这些原则和指导方针设计旅行智能体 #
假设你正在设计一个旅行智能体,以下是如何运用设计原则和指导方针的思路:
透明度 - 让用户知道旅行智能体是一个 AI 驱动的智能体。
- 提供一些基本的入门指导(例如"你好"消息、示例提示语)
- 在产品页面上清晰记录这些信息
- 显示用户过去询问的提示语列表
- 明确如何提供反馈(点赞和踩按钮、发送反馈按钮等)
- 清楚地说明智能体是否有使用或主题限制
控制权 - 确保用户明确知道如何在创建智能体后进行修改,比如:
- 系统提示语的设置
- 让用户能够选择智能体的详细程度、写作风格
- 设置智能体不应该谈论的内容
- 允许用户查看和删除任何相关文件、数据、提示语和过去的对话
一致性 - 确保标准化和可识别性:
- 分享提示语、添加文件或照片、标记某人或某物的图标要标准且易识别
- 使用回形针图标表示文件上传/与智能体共享
- 使用图像图标表示图形上传
其他资源 #
- Practices for Governing Agentic AI Systems | OpenAI
- The HAX Toolkit Project - Microsoft Research
- Responsible AI Toolbox