构建高效的Agent[译文&笔记]
📅 2025-01-15
原文: Building effective agents, 作者: Anthropic, Dec 20, 2024
过去一年,我们与数十个团队合作,构建了跨行业的大型语言模型(LLM)智能体。我们发现,最成功的实现并没有使用复杂的框架或专门的库,而是使用简单、可组合的模式构建的。
在这篇文章中,我们将分享我们与客户合作以及自行构建智能体的经验,并为开发人员提供构建有效智能体的实用建议。
...原文: Building effective agents, 作者: Anthropic, Dec 20, 2024
过去一年,我们与数十个团队合作,构建了跨行业的大型语言模型(LLM)智能体。我们发现,最成功的实现并没有使用复杂的框架或专门的库,而是使用简单、可组合的模式构建的。
在这篇文章中,我们将分享我们与客户合作以及自行构建智能体的经验,并为开发人员提供构建有效智能体的实用建议。
...Google AI产品Gemini的API有很多免费额度,而且兼容OpenAI API,我也开始使用了它的API了。
从免费额度上看Google还算慷慨, gemini-1.5-flash
每天1500次请求也足够个人学习使用。
模型名称 | 简介 | 免费层级限制 |
---|---|---|
gemini-1.5-flash | 速度最快的多模态模型,在各种重复性任务中表现出色,有100万的上下文窗口 | 15RPM, 1 million TPM, 1500RPD |
gemini-1.5-flash-8b | 最小的模型,适用于对智能要求不高的场景,100万上下文窗口 | 15RPM, 1 million TPM, 1500RPD |
gemini-1.5-pro | 下一代模型,200万上下文窗口,已经生产可用 | 2RPM, 32000TPM, 50RPD |
gemini-1.0-pro | 第一代模型仅提供文本和图像推理,生产可用 | 15RPM, 32000TPM, 1500RPD |
text-embedding-004 | 文本嵌入模型 | 1500RPM |
- RPM - requests per minute
- TPM - tokens per minute
- RPD requests per day
Gemini API的开通方式,是在Googlle AI Studio中申请API Key。
...原文: Agents, 作者: Julia Wiesinger, Patrick Marlow and Vladimir Vuskovic
正是推理(reasoning)、逻辑(logic)以及与生成式AI模型相连接的外部信息访问能力的结合,才催生了智能体的概念。
人类擅长复杂的模式识别,但常借助书籍、谷歌搜索或计算器等工具补充知识再做判断。类似地,生成式AI模型也能通过训练使用工具,访问实时信息或提供实际操作建议。例如,模型可利用数据库检索工具访问客户购买历史等信息,生成定制化推荐;或根据用户查询,通过API调用发送邮件或完成金融交易。为此,模型不仅需访问外部工具,还需自主规划和执行任务。推理、逻辑和与生成式AI模型相关的外部信息访问共同构成了智能体的概念,即超越生成式AI模型独立能力的程序。本文将详述这些及相关方面。
...Cargo是Rust的包管理器和构建工具。
运行cargo help
列出cargo的可用命令,基于cargo的不同版本,以下输出内容可能会有不同:
Rook v1.16发布了,这个版本的主要功能是改善Kubernetes的存储体验,为Ceph存储提供者(Ceph Storage Provider)带来了许多新功能。
对象存储扩展:增加了更多配置选项和灵活性,支持多个对象存储实例使用相同存储池。
S3桶策略:可为S3桶指定策略,使用JSON格式,并支持Ceph RGW的所有桶策略。
...构建CPython所需的功能和最低版本要求如下:
ssl
和hashlib
扩展模块。sqlite3
扩展模块。tkinter
模块。configure
脚本需要Autoconf 2.71和aclocal 1.16.5。1sudo apt-get update
2sudo apt-get upgrade
3sudo apt-get install -y make build-essential libssl-dev zlib1g-dev libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev xz-utils tk-dev liblzma-dev tk-dev
1sudo dnf -y update
2sudo dnf -y groupinstall "Development Tools"
3sudo dnf -y install wget gcc openssl-devel bzip2-devel libffi-devel xz-devel tk-devel
1curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo
2sed -i -e '/mirrors.cloud.aliyuncs.com/d' -e '/mirrors.aliyuncs.com/d' /etc/yum.repos.d/CentOS-Base.repo
3yum clean all
4yum makecache
5
6yum install centos-release-scl-rh
7sed -i 's#mirrorlist=http://mirrorlist.centos.org?arch=$basearch&release=7&repo=sclo-rh#\#mirrorlist=mirrorlist=http://mirrorlist.centos.org?arch=$basearch&release=7&repo=sclo-rh#g' /etc/yum.repos.d/CentOS-SCLo-scl-rh.repo
8sed -i 's#\#baseurl=http://mirror.centos.org/centos/7/sclo/$basearch/rh/#baseurl=https://mirrors.aliyun.com/centos/7/sclo/$basearch/rh/#g' /etc/yum.repos.d/CentOS-SCLo-scl-rh.repo
9yum clean all
10yum makecache
11yum install devtoolset-11-gcc devtoolset-11-gcc-c++ devtoolset-11-binutils
12scl enable devtoolset-11 bash
编译安装新版openssl,要求3.0.9版本以上。
...备份PostgreSQL有三种不同的方法:
在任何时候,PostgreSQL都会在集群数据目录的pg_wal/
子目录中维护一个写前日志(WAL)。该日志记录了对数据库数据文件所做的每个更改。这个日志主要用于崩溃安全:如果系统崩溃,可以通过“重放”自上次检查点以来的日志条目,将数据库恢复到一致性状态。WAL日志的存在使得使用第三种备份策略成为可能:我们可以将文件系统级备份与WAL文件的备份相结合。如果需要恢复,只需恢复文件系统备份,再重放备份的WAL文件,将系统恢复到当前状态。这种方法比前两种方法更复杂,但它有一些显著的优势:
OPENAI Assistants API概述:构建AI助手,并提供工具和集成功能
OPENAI的Assistants API允许我们在自己的应用程序中构建AI助手。助手包含指令(instructions),并可以利用模型(models)、工具(tools)和文件(files)来响应用户查询。Assistants API 当前支持三种类型的工具:代码解释器、文件搜索和函数调用。
...智能体(AI Agent)不仅仅是一个简单的程序,它能够通过与环境的互动,完成复杂的任务。而其中,大型语言模型(LLM)在智能体中的应用,十分重要。
简单来说,智能体可以看作是一个能够理解命令、执行任务并与环境互动的“代理”。它不仅能够接受指令,还能根据自身的目标和环境情况,决定采取什么行动。
...