Blog

构建高效的Agent[译文&笔记]

📅 2025-01-15

原文: Building effective agents, 作者: Anthropic, Dec 20, 2024

过去一年,我们与数十个团队合作,构建了跨行业的大型语言模型(LLM)智能体。我们发现,最成功的实现并没有使用复杂的框架或专门的库,而是使用简单、可组合的模式构建的。

在这篇文章中,我们将分享我们与客户合作以及自行构建智能体的经验,并为开发人员提供构建有效智能体的实用建议。

...

开始使用Gemini API

📅 2025-01-14

Google AI产品Gemini的API有很多免费额度,而且兼容OpenAI API,我也开始使用了它的API了。

免费额度 #

从免费额度上看Google还算慷慨, gemini-1.5-flash每天1500次请求也足够个人学习使用。

模型名称简介免费层级限制
gemini-1.5-flash速度最快的多模态模型,在各种重复性任务中表现出色,有100万的上下文窗口15RPM, 1 million TPM, 1500RPD
gemini-1.5-flash-8b最小的模型,适用于对智能要求不高的场景,100万上下文窗口15RPM, 1 million TPM, 1500RPD
gemini-1.5-pro下一代模型,200万上下文窗口,已经生产可用2RPM, 32000TPM, 50RPD
gemini-1.0-pro第一代模型仅提供文本和图像推理,生产可用15RPM, 32000TPM, 1500RPD
text-embedding-004文本嵌入模型1500RPM
  • RPM - requests per minute
  • TPM - tokens per minute
  • RPD requests per day

开通Gemini API #

Gemini API的开通方式,是在Googlle AI Studio中申请API Key。

...

Google Agent白皮书[译文&笔记]

📅 2025-01-07

原文: Agents, 作者: Julia Wiesinger, Patrick Marlow and Vladimir Vuskovic

正是推理(reasoning)、逻辑(logic)以及与生成式AI模型相连接的外部信息访问能力的结合,才催生了智能体的概念。

1.引言 #

人类擅长复杂的模式识别,但常借助书籍、谷歌搜索或计算器等工具补充知识再做判断。类似地,生成式AI模型也能通过训练使用工具,访问实时信息或提供实际操作建议。例如,模型可利用数据库检索工具访问客户购买历史等信息,生成定制化推荐;或根据用户查询,通过API调用发送邮件或完成金融交易。为此,模型不仅需访问外部工具,还需自主规划和执行任务。推理、逻辑和与生成式AI模型相关的外部信息访问共同构成了智能体的概念,即超越生成式AI模型独立能力的程序。本文将详述这些及相关方面。

...

Cargo简明教程

📅 2024-12-27

Cargo是Rust的包管理器和构建工具。

Cargo 简明教程

1.基本使用 #

1.1 帮助 #

运行cargo help列出cargo的可用命令,基于cargo的不同版本,以下输出内容可能会有不同:

...

Rook v1.16的新特性: 存储增强

📅 2024-12-18

Rook v1.16发布了,这个版本的主要功能是改善Kubernetes的存储体验,为Ceph存储提供者(Ceph Storage Provider)带来了许多新功能。

Rook v1.16

存储增强 #

  1. 对象存储扩展:增加了更多配置选项和灵活性,支持多个对象存储实例使用相同存储池。

    • 支持不同端口和域的托管与网关配置。
    • 支持 S3、Swift 和/或 Admin-Ops 协议。
    • 支持配置每个 RGW 实例的资源和限制。
  2. S3桶策略:可为S3桶指定策略,使用JSON格式,并支持Ceph RGW的所有桶策略。

    ...

从源码构建、编译和安装Python 3.13

📅 2024-12-17

构建需求 #

构建CPython所需的功能和最低版本要求如下:

  • C11编译器。不需要支持C11的可选功能
  • OpenSSL 的最低版本为1.1.1,推荐最低版本为3.0.9,用于sslhashlib扩展模块。
  • SQLite的最低版本为3.15.2,用于 sqlite3 扩展模块。
  • Tcl/Tk的最低版本为8.5.12,用于 tkinter 模块。
  • 重新生成configure脚本需要Autoconf 2.71和aclocal 1.16.5。

准备工作 #

安装依赖和构建工具 #

1sudo apt-get update
2sudo apt-get upgrade
3sudo apt-get install -y make build-essential libssl-dev zlib1g-dev libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev xz-utils tk-dev liblzma-dev tk-dev
1sudo dnf -y update
2sudo dnf -y groupinstall "Development Tools"
3sudo dnf -y install wget gcc openssl-devel bzip2-devel libffi-devel xz-devel tk-devel
 1curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo
 2sed -i -e '/mirrors.cloud.aliyuncs.com/d' -e '/mirrors.aliyuncs.com/d' /etc/yum.repos.d/CentOS-Base.repo
 3yum clean all
 4yum makecache
 5
 6yum install centos-release-scl-rh
 7sed -i 's#mirrorlist=http://mirrorlist.centos.org?arch=$basearch&release=7&repo=sclo-rh#\#mirrorlist=mirrorlist=http://mirrorlist.centos.org?arch=$basearch&release=7&repo=sclo-rh#g' /etc/yum.repos.d/CentOS-SCLo-scl-rh.repo
 8sed -i 's#\#baseurl=http://mirror.centos.org/centos/7/sclo/$basearch/rh/#baseurl=https://mirrors.aliyun.com/centos/7/sclo/$basearch/rh/#g' /etc/yum.repos.d/CentOS-SCLo-scl-rh.repo
 9yum clean all
10yum makecache
11yum install devtoolset-11-gcc devtoolset-11-gcc-c++ devtoolset-11-binutils
12scl enable devtoolset-11 bash

编译安装新版openssl,要求3.0.9版本以上。

...

PostgreSQL的增量备份和时间点还原(PITR)

📅 2024-12-12

备份PostgreSQL有三种不同的方法:

  • SQL Dump
  • 文件系统级备份 - (限制:数据库服务器必须关闭才能获得可用的备份)
  • 持续归档和时间点还原(PITR)

在任何时候,PostgreSQL都会在集群数据目录的pg_wal/子目录中维护一个写前日志(WAL)。该日志记录了对数据库数据文件所做的每个更改。这个日志主要用于崩溃安全:如果系统崩溃,可以通过“重放”自上次检查点以来的日志条目,将数据库恢复到一致性状态。WAL日志的存在使得使用第三种备份策略成为可能:我们可以将文件系统级备份与WAL文件的备份相结合。如果需要恢复,只需恢复文件系统备份,再重放备份的WAL文件,将系统恢复到当前状态。这种方法比前两种方法更复杂,但它有一些显著的优势:

...

OPENAI Assistants API学习笔记

📅 2024-12-05

1.OPENAI Assistants API概述 #

OPENAI Assistants API概述:构建AI助手,并提供工具和集成功能

OPENAI的Assistants API允许我们在自己的应用程序中构建AI助手。助手包含指令(instructions),并可以利用模型(models)、工具(tools)和文件(files)来响应用户查询。Assistants API 当前支持三种类型的工具:代码解释器、文件搜索和函数调用。

...

理解智能体(AI Agent)

📅 2024-12-04

智能体(AI Agent)不仅仅是一个简单的程序,它能够通过与环境的互动,完成复杂的任务。而其中,大型语言模型(LLM)在智能体中的应用,十分重要。

什么是智能体? #

智能体/Agent/代理 #

简单来说,智能体可以看作是一个能够理解命令、执行任务并与环境互动的“代理”。它不仅能够接受指令,还能根据自身的目标和环境情况,决定采取什么行动。

...

© 2025 青蛙小白 | 总访问量 | 总访客数