Aigc | 青蛙小白

Aigc

使用modelscope下载模型

📅 2025-03-08

see also “使用huggingface-cli下载模型”

安装ModelScope SDK #

安装环境信息如下:

操作系统: Ubuntu 24.04
安装用户: 系统普通用户(非root, 非特权用户)
Python版本: 3.11 (注Ubuntu 24.04内置安装了Python 3.12, Python 3.11需额外安装)

安装过程如下:

...

AI Agents for Beginners笔记: 5.Agentic RAG

📅 2025-02-24

代理式检索增强生成（Agentic RAG），这是一种新兴的人工智能范式，其中大型语言模型（LLM）在从外部来源获取信息的同时，自主规划其下一步行动。与静态的先检索后阅读模式不同，Agentic RAG 涉及对 LLM 的迭代调用，中间穿插工具或函数调用以及结构化输出。系统会评估结果，优化查询，必要时调用额外的工具，并持续循环此过程，直到获得满意的解决方案。

...

DeepSeek-R1 671B满血版部署硬件配置

📅 2025-02-20

DeepSeek R1是DeepSeek公司于2025年1月20日发布的推理模型，被认为媲美OpenAI的o1模型。DeepSeek R1满血版：

模型	总参数量	激活参数量	上下文长度	下载链接
DeepSeek-R1-Zero	671B	37B	128K	🤗 HuggingFace
DeepSeek-R1	671B	37B	128K	🤗 HuggingFace

DeepSeek R1作为一个超大规模模型，其部署有严格的硬件要求，特别是在GPU内存和计算能力方面。

...

AutoGen笔记：02.工具使用

📅 2025-02-20

通过本节的学习，将学会如何使用AutoGen定义智能体并调用函数和工具。

在这个例子中，我们将赋予智能体一个工具的访问权限，该工具是一个函数，包含可用度假目的地的列表及其度假目的地的可用性。可以认为这是一个旅行社的智能体可以访问旅行数据库的场景。

...

AI Agents for Beginners笔记: 4.工具使用设计模式

📅 2025-02-19

工具之所以有趣，是因为它们使AI智能体能够拥有更广泛的能力范围。通过添加工具，智能体不再局限于一组有限的动作，而是能够执行多种多样的动作。在本章中，我们将探讨工具使用设计模式，该模式描述了AI智能体如何使用特定工具来实现其目标。

什么是工具使用设计模式？ #

工具使用设计模式聚焦于赋予大语言模型（LLMs）与外部工具交互的能力，以实现特定目标。工具是可以由智能体执行的代码，用于执行动作。一个工具可以是简单的函数，例如计算器，或者是对第三方服务的API调用，例如查询股票价格或天气预报。在AI智能体的背景下，工具被设计为由智能体根据模型生成的函数调用来执行。

...

AI Agents for Beginners笔记: 3.AI智能体设计原则

📅 2025-02-19

关于构建AI智能系统，有许多不同的思考方式。由于在生成式AI设计中，模糊性是一种特性而非缺陷，因此工程师有时会难以确定从哪里开始。

《AI Agents for Beginners》制定了一套以人为中心的用户体验设计原则，旨在帮助开发者构建以客户为中心的智能体系统，以满足他们的业务需求。这些设计原则并不是一种规定性的架构，而是为定义和构建智能体体验的团队提供的起点。

...

AutoGen笔记：01.从零开始构建第一个AI智能体

📅 2025-02-18

AutoGen是什么？ #

AutoGen是一个用于构建AI智能体和应用程序的框架。

AutoGen框架由以下几个部分组成：

基于AutoGen 0.4.x版本

Core
AgentChat
Extensions
Studio
Magentic-One CLI

Core #

AutoGen Core 是一个用于构建可扩展的多智能体AI系统的事件驱动编程框架。示例场景：

用于业务流程的确定性和动态的智能体工作流程。
多智能体协作研究。
用于多语言应用程序的分布式智能体。

如果你正在构建工作流程或分布式智能体系统，请从这里开始。

...

AI Agents for Beginners笔记: 2.探索Agent框架

📅 2025-02-17

AI Agent 框架是专为简化 AI Agent 的创建、部署和管理而设计的软件平台。这些框架为开发者提供了预构建的组件、抽象和工具，从而简化了复杂 AI 系统的开发流程。

通过为 AI Agent 开发中的常见挑战提供标准化的方法，这些框架帮助开发者专注于应用的独特部分。它们提升了构建 AI 系统的可扩展性、可访问性和效率。

...

AI Agents for Beginners笔记: 1.AI Agent及使用场景简介

📅 2025-02-17

本文是微软AI Agents for Beginners课程的学习笔记。随着AI技术的发展，AI Agent正在成为构建智能应用的重要范式。本文将介绍AI Agent的基础概念、类型和应用场景。

AI Agent的定义和类型 #

AI Agent的定义 #

AI Agent是通过为LLMs(大语言模型)提供tools(工具)和knowledge(知识)的访问权限，从而扩展其能力以执行操作(action)的系统(system)。

...

开始使用Gemini API

📅 2025-01-14

Google AI产品Gemini的API有很多免费额度，而且兼容OpenAI API，我也开始使用了它的API了。

免费额度 #

从免费额度上看Google还算慷慨， gemini-1.5-flash每天1500次请求也足够个人学习使用。

https://ai.google.dev/pricing

模型名称	简介	免费层级限制
gemini-1.5-flash	速度最快的多模态模型，在各种重复性任务中表现出色，有100万的上下文窗口	15RPM, 1 million TPM, 1500RPD
gemini-1.5-flash-8b	最小的模型，适用于对智能要求不高的场景，100万上下文窗口	15RPM, 1 million TPM, 1500RPD
gemini-1.5-pro	下一代模型，200万上下文窗口，已经生产可用	2RPM, 32000TPM, 50RPD
gemini-1.0-pro	第一代模型仅提供文本和图像推理，生产可用	15RPM, 32000TPM, 1500RPD
text-embedding-004	文本嵌入模型	1500RPM

RPM - requests per minute
TPM - tokens per minute
RPD requests per day

开通Gemini API #

Gemini API的开通方式，是在Googlle AI Studio中申请API Key。

...