Embedding models #
https://python.langchain.com/docs/concepts/#embedding-models
嵌入模型为一段文本创建向量表示。你可以将向量视为一个数字数组,它捕捉了文本的语义意义。通过这种方式表示文本,你可以进行数学运算,比如搜索语义上最相似的其他文本片段。这些自然语言搜索功能支持许多类型的上下文检索,在其中我们为大型语言模型提供其有效响应查询所需的相关数据。
嵌入类(Embeddings class)是为与文本嵌入模型进行交互而设计的类。有许多不同的嵌入模型提供商(如 OpenAI、Cohere、Hugging Face 等)以及本地模型,而该类旨在为所有这些提供标准接口。
LangChain 中的基本嵌入类提供了两个方法:一个用于嵌入文档,另一个用于嵌入查询。前者接受多个文本作为输入,而后者只接受一个文本。将它们分为两个独立方法的原因在于,一些嵌入提供商对于文档(用于搜索的内容)和查询(搜索本身)有不同的嵌入方法。
有关如何使用嵌入模型的详细信息,请参阅此处的相关操作指南。