嵌入模型

添加嵌入模型
在模型管理服务中查找模型,可以点击“嵌入模型”快速筛选;

找到需要的模型,添加到我的模型。

注意:

嵌入类模型、对话类模型、绘画类模型等各自有各自的功能,其请求方式跟返回内容、结构都有所不同,请勿强行将其他类别的模型作为嵌入模型使用;

嵌入类模型CherryStudio会自动分类显示在嵌入模型列表中(如上图),如果确认为嵌入模型但未被正确分类,可到模型列表中点击对应模型后方的设置按钮勾选嵌入选项;

如果无法确认哪些模型是嵌入模型可到对应服务商查询模型信息。

创建知识库
知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标,即可进入管理页面;

添加知识库:点击添加,开始创建知识库;

命名:输入知识库的名称并添加嵌入模型,以 bge-m3 为例,即可完成创建。

添加文件并向量化
添加文件:点击添加文件的按钮,打开文件选择;

选择文件:选择支持的文件格式,如 pdf,docx,pptx,xlsx,txt,md,mdx 等,并打开;

向量化:系统会自动进行向量化处理,当显示完成时(绿色 ✓),代表向量化已完成。

添加多种来源的数据
CherryStudio 支持多种添加数据的方式:

文件夹目录:可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化;

网址链接:支持网址 url,如https://docs.siliconflow.cn/introduction;

站点地图:支持 xml 格式的站点地图,如https://docs.siliconflow.cn/sitemap.xml;

纯文本笔记:支持输入纯文本的自定义内容。

提示:

导入知识库的文档中的插图暂不支持转换为向量,需要手动转换为文本;

使用网址作为知识库来源时不一定会成功,有些网站有比较严格的反扒机制(或需要登录、授权等),因此该方式不一定能获取到准确内容。创建完成后建议先搜索测试一下。

一般网站都会提供sitemap,如CherryStudio的sitemap,一般情况下在网站的根地址(即网址)后加/sitemap.xml可以获取到相关信息。如 aaa.com/sitemap.xml 。

如果网站没提供sitemap或者网址比较杂可自行组合一个sitemap的xml文件使用,文件暂时需要使用公网可直接访问的直链的方式填入,本地文件链接不会被识别。

可以让AI生成sitemap文件或让AI写一个sitemap的HTML生成器工具;

直链可以使用oss直链或者网盘直链等方式来生成。如果没有现成工具也可到ocoolAI官网,登录后使用网站顶栏的免费文件上传工具来生成直链。

搜索知识库
当文件等资料向量化完成后,即可进行查询:

点击页面下方的搜索知识库按钮;

输入查询的内容;

呈现搜索的结果;

并显示该条结果的匹配分数。

对话中引用知识库生成回复
创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;

输入并发送问题,模型即返回通过检索结果生成的答案 ;

同时,引用的数据来源会附在答案下方,可快捷查看源文件。

作者:Jeebiz  创建时间:2025-02-20 23:34
最后编辑:Jeebiz  更新时间:2025-02-23 15:55