Blog

PostgreSQL的增量备份和时间点还原(PITR)

📅 2024-12-12

备份PostgreSQL有三种不同的方法:

  • SQL Dump
  • 文件系统级备份 - (限制:数据库服务器必须关闭才能获得可用的备份)
  • 持续归档和时间点还原(PITR)

在任何时候,PostgreSQL都会在集群数据目录的pg_wal/子目录中维护一个写前日志(WAL)。该日志记录了对数据库数据文件所做的每个更改。这个日志主要用于崩溃安全:如果系统崩溃,可以通过“重放”自上次检查点以来的日志条目,将数据库恢复到一致性状态。WAL日志的存在使得使用第三种备份策略成为可能:我们可以将文件系统级备份与WAL文件的备份相结合。如果需要恢复,只需恢复文件系统备份,再重放备份的WAL文件,将系统恢复到当前状态。这种方法比前两种方法更复杂,但它有一些显著的优势:

...

OPENAI Assistants API学习笔记

📅 2024-12-05

1.OPENAI Assistants API概述 #

OPENAI Assistants API概述:构建AI助手,并提供工具和集成功能

OPENAI的Assistants API允许我们在自己的应用程序中构建AI助手。助手包含指令(instructions),并可以利用模型(models)、工具(tools)和文件(files)来响应用户查询。Assistants API 当前支持三种类型的工具:代码解释器、文件搜索和函数调用。

...

理解智能体(AI Agent)

📅 2024-12-04

智能体(AI Agent)不仅仅是一个简单的程序,它能够通过与环境的互动,完成复杂的任务。而其中,大型语言模型(LLM)在智能体中的应用,十分重要。

什么是智能体? #

智能体/Agent/代理 #

简单来说,智能体可以看作是一个能够理解命令、执行任务并与环境互动的“代理”。它不仅能够接受指令,还能根据自身的目标和环境情况,决定采取什么行动。

...

记一次K8S Flannel VXLAN网络跨节点Pod通信问题排查

📅 2024-12-02

问题 #

今天一个用户的K8S集群出现了问题。用户反馈集群中的业务Pod之间无法通信。在业务Pod中,执行 nslookup 目标Pod的service name时无法解析。

该K8S集群的信息如下:

  • Kubernetes版本:1.29.2
  • 容器网络:Flannel(backend type: VXLAN)

用户检查了CoreDNS的Pod,都正常运行。

...

Rook 1.15部署指南: 使用Rook 1.15部署和管理Ceph(Squid) 19.2.0

📅 2024-11-25

Rook是一个开源的云原生存储编排器,为Ceph存储提供平台、框架和支持,使其能够与云原生环境进行本地集成。Ceph是一个分布式存储系统,提供文件(file)、块(block)和对象存储(object storage),并在大规模生产集群中部署。

...

从Disqus迁移到Remark42

📅 2024-11-17

作为Diqus的免费用户,被强制挂上广告,无奈之下只好替代!

安装Remark42 #

下载:

1wget https://github.com/umputun/remark42/releases/download/v1.14.0/remark42.linux-amd64.tar.gz

创建用户和数据目录:

1useradd remark42
2mkdir /home/remark42/data
3chown -R remark42:remark42 /home/remark42/data

安装:

1tar -zxvf remark42.linux-amd64.tar.gz
2mv remark42.linux-amd64 /home/remark42/remark42

创建配置文件:

1vi /home/remark42/remark42.env
1REMARK_URL=https://comments.frognew.com
2SECRET=xxxx
3SITE=frognew
4AUTH_ANON=false
5EMOJI=true
6REMARK_PORT=8083
7REMARK_ADDRESS=127.0.0.1
8AUTH_GITHUB_CID=xxxx
9AUTH_GITHUB_CSEC=xxxx

/etc/systemd/system/remark42.service:

...

使用Text Generation Inference运行大模型

📅 2024-11-04

TGI简介 #

Text Generation Inference(TGI)是一个用于部署和提供大型语言模型(LLMs)服务的工具包。TGI支持高性能文本生成,适用于最受欢迎的开源大语言模型,包括Llama、Falcon、StarCoder、BLOOM、GPT-NeoX和T5。

...

使用Text Embeddings Inference运行Embeddings模型和Rerank模型

📅 2024-10-21

TEI简介 #

Text Embeddings Inference(TEI)是一个全面的工具包,旨在高效地部署和服务开源文本嵌入模型。它支持对最流行的模型进行高性能提取,包括FlagEmbedding、Ember、GTE和E5。

TEI提供多种功能,旨在优化部署过程并提高整体性能。

...

在Xinference中使用Rerank模型BAAI/bge-reranker-v2-m3

📅 2024-10-21

在RAG中,Rerank是一种对初步检索到的多个候选文档进行重新评分和排序的技术,确保生成模型基于最相关的文档生成回答。通过Rerank,可以剔除不相关的文档,优化检索结果,提高生成模型的准确性和回答质量。这一步对提升生成结果的相关性和减少无关信息至关重要。

...

使用LlamaEdge+WasmEdge在本地运行大模型千问2.5

📅 2024-10-15

本文将使用LlamaEdge+WasmEdge来在本地部署Qwen2.5-0.5B-Instruct-GGUF。

系统环境 #

  • Ubuntu 24.04 (无GPU,将部署为在CPU上推理)

安装WasmEdge #

参考“安装和开始使用WasmEdge”

wasmedge版本信息如下:

1wasmedge -v
2wasmedge version 0.14.1
3 (plugin "wasi_logging") version 0.1.0.0
4~/.wasmedge/lib/../plugin/libwasmedgePluginWasiNN.so (plugin "wasi_nn") version 0.10.1.0

下载LlamaEdge API Sserver #

LlamaEdge API Server是一个跨平台的可移植 Wasm 应用,可以在不同CPU和GPU设备上运行。

...

© 2025 青蛙小白 | 总访问量 | 总访客数