
📅 2024-12-12
备份PostgreSQL有三种不同的方法:
- SQL Dump
- 文件系统级备份 - (限制:数据库服务器必须关闭才能获得可用的备份)
- 持续归档和时间点还原(PITR)
在任何时候,PostgreSQL都会在集群数据目录的pg_wal/
子目录中维护一个写前日志(WAL)。该日志记录了对数据库数据文件所做的每个更改。这个日志主要用于崩溃安全:如果系统崩溃,可以通过“重放”自上次检查点以来的日志条目,将数据库恢复到一致性状态。WAL日志的存在使得使用第三种备份策略成为可能:我们可以将文件系统级备份与WAL文件的备份相结合。如果需要恢复,只需恢复文件系统备份,再重放备份的WAL文件,将系统恢复到当前状态。这种方法比前两种方法更复杂,但它有一些显著的优势:
...📅 2024-12-05
1.OPENAI Assistants API概述
#
OPENAI Assistants API概述:构建AI助手,并提供工具和集成功能
OPENAI的Assistants API允许我们在自己的应用程序中构建AI助手。助手包含指令(instructions),并可以利用模型(models)、工具(tools)和文件(files)来响应用户查询。Assistants API 当前支持三种类型的工具:代码解释器、文件搜索和函数调用。
...📅 2024-12-04
智能体(AI Agent)不仅仅是一个简单的程序,它能够通过与环境的互动,完成复杂的任务。而其中,大型语言模型(LLM)在智能体中的应用,十分重要。
什么是智能体?
#
智能体/Agent/代理
#
简单来说,智能体可以看作是一个能够理解命令、执行任务并与环境互动的“代理”。它不仅能够接受指令,还能根据自身的目标和环境情况,决定采取什么行动。
...📅 2024-12-02
问题
#
今天一个用户的K8S集群出现了问题。用户反馈集群中的业务Pod之间无法通信。在业务Pod中,执行 nslookup
目标Pod的service name时无法解析。
该K8S集群的信息如下:
- Kubernetes版本:1.29.2
- 容器网络:Flannel(backend type: VXLAN)
用户检查了CoreDNS的Pod,都正常运行。
...📅 2024-11-25
Rook是一个开源的云原生存储编排器,为Ceph存储提供平台、框架和支持,使其能够与云原生环境进行本地集成。Ceph是一个分布式存储系统,提供文件(file)、块(block)和对象存储(object storage),并在大规模生产集群中部署。
...📅 2024-11-17
作为Diqus的免费用户,被强制挂上广告,无奈之下只好替代!
下载:
1wget https://github.com/umputun/remark42/releases/download/v1.14.0/remark42.linux-amd64.tar.gz
创建用户和数据目录:
1useradd remark42
2mkdir /home/remark42/data
3chown -R remark42:remark42 /home/remark42/data
安装:
1tar -zxvf remark42.linux-amd64.tar.gz
2mv remark42.linux-amd64 /home/remark42/remark42
创建配置文件:
1vi /home/remark42/remark42.env
1REMARK_URL=https://comments.frognew.com
2SECRET=xxxx
3SITE=frognew
4AUTH_ANON=false
5EMOJI=true
6REMARK_PORT=8083
7REMARK_ADDRESS=127.0.0.1
8AUTH_GITHUB_CID=xxxx
9AUTH_GITHUB_CSEC=xxxx
/etc/systemd/system/remark42.service
:
...📅 2024-11-04
TGI简介
#
Text Generation Inference(TGI)是一个用于部署和提供大型语言模型(LLMs)服务的工具包。TGI支持高性能文本生成,适用于最受欢迎的开源大语言模型,包括Llama、Falcon、StarCoder、BLOOM、GPT-NeoX和T5。
...📅 2024-10-21
TEI简介
#
Text Embeddings Inference(TEI)是一个全面的工具包,旨在高效地部署和服务开源文本嵌入模型。它支持对最流行的模型进行高性能提取,包括FlagEmbedding、Ember、GTE和E5。
TEI提供多种功能,旨在优化部署过程并提高整体性能。
...📅 2024-10-21
在RAG中,Rerank是一种对初步检索到的多个候选文档进行重新评分和排序的技术,确保生成模型基于最相关的文档生成回答。通过Rerank,可以剔除不相关的文档,优化检索结果,提高生成模型的准确性和回答质量。这一步对提升生成结果的相关性和减少无关信息至关重要。
...📅 2024-10-15
本文将使用LlamaEdge+WasmEdge来在本地部署Qwen2.5-0.5B-Instruct-GGUF。
系统环境
#
- Ubuntu 24.04 (无GPU,将部署为在CPU上推理)
安装WasmEdge
#
参考“安装和开始使用WasmEdge”。
wasmedge版本信息如下:
1wasmedge -v
2wasmedge version 0.14.1
3 (plugin "wasi_logging") version 0.1.0.0
4~/.wasmedge/lib/../plugin/libwasmedgePluginWasiNN.so (plugin "wasi_nn") version 0.10.1.0
下载LlamaEdge API Sserver
#
LlamaEdge API Server是一个跨平台的可移植 Wasm 应用,可以在不同CPU和GPU设备上运行。
...