Milvus
Milvus 是一款开源的向量数据库,在数据科学和机器学习领域引起了广泛关注。其显著特点之一在于对向量索引与查询的强大支持。Milvus 采用最前沿的尖端算法加速搜索过程,使其在处理大规模数据集时,也能异常高效地检索相似向量。
先决条件
- 运行 Milvus 实例。可以使用以下选项:
- Milvus 单机版:Docker、Operator、Helm、DEB/RPM、Docker Compose。
- Milvus Cluster:Operator, Helm。
- 如果需要, 可以给 EmbeddingClient 配置 API 密钥,生成嵌入结果并通过
MilvusVectorStore
存储.
依赖项
然后将 Milvus VectorStore 启动器依赖项添加到您的项目中:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-vector-store-milvus</artifactId>
</dependency>
或者,在你的 Gradle 构建文件 build.gradle
中添加:
dependencies {
implementation 'org.springframework.ai:spring-ai-starter-vector-store-milvus'
}
向量存储的实现可以为您初始化所需的架构,但您必须通过指定构造函数中的 initializeSchema
布尔值或在 application.properties
文件中设置 initialize-schema=true
来选择启用。
要连接到并配置MilvusVectorStore
,您需要提供实例的访问详细信息。可以通过 Spring Boot 提供简单的配置 application.yml
spring:
ai:
vectorstore:
milvus:
client:
host: "localhost"
port: 19530
username: "root"
password: "milvus"
databaseName: "default"
collectionName: "vector_store"
embeddingDimension: 1536
indexType: IVF_FLAT
metricType: COSINE
现在您可以在应用程序中自动连接 Milvus Vector Store 并使用它
@Autowired VectorStore vectorStore;
// ...
List <Document> documents = List.of(
new Document("Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!!", Map.of("meta1", "meta1")),
new Document("The World is Big and Salvation Lurks Around the Corner"),
new Document("You walk forward facing the past and you turn back toward the future.", Map.of("meta2", "meta2")));
// Add the documents to Milvus Vector Store
vectorStore.add(documents);
// Retrieve documents similar to a query
List<Document> results = this.vectorStore.similaritySearch(SearchRequest.builder().query("Spring").topK(5).build());
手动配置
不使用 Spring Boot 的自动配置,您可以手动配置 MilvusVectorStore。将以下依赖项添加到您的项目中:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-milvus-store</artifactId>
</dependency>
要在您的应用程序中配置 MilvusVectorStore,可以使用以下设置:
@Bean
public VectorStore vectorStore(MilvusServiceClient milvusClient, EmbeddingModel embeddingModel) {
return MilvusVectorStore.builder(milvusClient, embeddingModel)
.collectionName("test_vector_store")
.databaseName("default")
.indexType(IndexType.IVF_FLAT)
.metricType(MetricType.COSINE)
.batchingStrategy(new TokenCountBatchingStrategy())
.initializeSchema(true)
.build();
}
@Bean
public MilvusServiceClient milvusClient() {
return new MilvusServiceClient(ConnectParam.newBuilder()
.withAuthorization("minioadmin", "minioadmin")
.withUri(milvusContainer.getEndpoint())
.build());
}
元数据过滤
您可以在 Milvus 存储中使用通用的、可移植的 元数据过滤器 。
例如,您可以使用文本表达式语言:
vectorStore.similaritySearch(
SearchRequest.builder()
.query("The World")
.topK(TOP_K)
.similarityThreshold(SIMILARITY_THRESHOLD)
.filterExpression("author in ['john', 'jill'] && article_type == 'blog'").build());
或通过编程方式使用 Filter.Expression DSL
:
FilterExpressionBuilder b = new FilterExpressionBuilder();
vectorStore.similaritySearch(SearchRequest.builder()
.query("The World")
.topK(TOP_K)
.similarityThreshold(SIMILARITY_THRESHOLD)
.filterExpression(b.and(
b.in("author","john", "jill"),
b.eq("article_type", "blog")).build()).build());
使用 MilvusSearchRequest
MilvusSearchRequest
继承自 SearchRequest,使您能够使用 Milvus 特有的搜索参数,如原生表达式和搜索参数 JSON。
MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
.query("sample query")
.topK(5)
.similarityThreshold(0.7)
.nativeExpression("metadata[\"age\"] > 30") // Overrides filterExpression if both are set
.filterExpression("age <= 30") // Ignored if nativeExpression is set
.searchParamsJson("{\"nprobe\":128}")
.build();
List results = vectorStore.similaritySearch(request);
原生表达式与搜索参数 JSON 在 MilvusSearchRequest 中的重要性
这两个参数提升了 Milvus 搜索的精确度,并确保了查询性能的最优化。
NativeExpression:启用使用 Milvus 原生过滤表达式进行额外过滤的功能。Milvus 过滤
示例:
MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
.query("sample query")
.topK(5)
.nativeExpression("metadata['category'] == 'science'")
.build();
SearchParamsJson:在使用 Milvus 默认索引 IVF_FLAT 时,用于调优搜索行为的关键参数。Milvus 向量索引
默认情况下,IVF_FLAT 需要设置 nprobe 以确保结果准确。如果未指定,nprobe 默认为 1,这可能导致召回率低甚至搜索结果为零。
示例:
MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
.query("sample query")
.topK(5)
.searchParamsJson("{\"nprobe\":128}")
.build();
使用原生表达式(nativeExpression)能确保高级过滤,而搜索参数 JSON(searchParamsJson)则避免了因默认 nprobe 值过低导致的搜索效率低下问题。
Milvus 向量存储属性
您可以在 Spring Boot 配置中使用以下属性来定制 Milvus 向量存储。
属性 (Property) | 描述 (Description) | 默认值 (Default value) |
---|---|---|
spring.ai.vectorstore.milvus.database-name |
要使用的 Milvus 数据库名称。 | default |
spring.ai.vectorstore.milvus.collection-name |
用于存储向量的 Milvus 集合 (Collection) 名称。 | vector_store |
spring.ai.vectorstore.milvus.initialize-schema |
是否初始化 Milvus 的后端模式 (Schema)。 | false |
spring.ai.vectorstore.milvus.embedding-dimension |
要存储在 Milvus 集合中的向量的维度。 | 1536 |
spring.ai.vectorstore.milvus.index-type |
要为 Milvus 集合创建的索引类型。 | IVF_FLAT |
spring.ai.vectorstore.milvus.metric-type |
用于 Milvus 集合的距离度量类型。 | COSINE (余弦) |
spring.ai.vectorstore.milvus.index-parameters |
用于 Milvus 集合的索引参数。 | {"nlist":1024} |
spring.ai.vectorstore.milvus.id-field-name |
集合的 ID 字段名称。 | doc_id |
spring.ai.vectorstore.milvus.auto-id |
布尔标志,指示 ID 字段是否使用自动生成 ID。 | false |
spring.ai.vectorstore.milvus.content-field-name |
集合的内容字段名称。 | content |
spring.ai.vectorstore.milvus.metadata-field-name |
集合的元数据字段名称。 | metadata |
spring.ai.vectorstore.milvus.embedding-field-name |
集合的嵌入向量字段名称。 | embedding |
spring.ai.vectorstore.milvus.client.host |
主机的主机名或地址。 | localhost |
spring.ai.vectorstore.milvus.client.port |
连接端口。 | 19530 |
spring.ai.vectorstore.milvus.client.uri |
Milvus 实例的 URI。 | - |
spring.ai.vectorstore.milvus.client.token |
用作识别和认证密钥的令牌 (Token)。 | - |
spring.ai.vectorstore.milvus.client.connect-timeout-ms |
客户端通道的连接超时值(毫秒)。超时值必须大于零。 | 10000 |
spring.ai.vectorstore.milvus.client.keep-alive-time-ms |
客户端通道的保持活动时间值(毫秒)。保持活动值必须大于零。 | 55000 |
spring.ai.vectorstore.milvus.client.keep-alive-timeout-ms |
客户端通道的保持活动超时值(毫秒)。超时值必须大于零。 | 20000 |
spring.ai.vectorstore.milvus.client.rpc-deadline-ms |
等待服务器回复的最后期限(毫秒)。设置此值后,客户端在遇到由网络波动引起的快速 RPC 失败时会等待。最后期限值必须大于或等于零。 | 0 |
spring.ai.vectorstore.milvus.client.client-key-path |
TLS 双向认证的 client.key 路径,仅在 “secure” 为 true 时生效。 | - |
spring.ai.vectorstore.milvus.client.client-pem-path |
TLS 双向认证的 client.pem 路径,仅在 “secure” 为 true 时生效。 | - |
spring.ai.vectorstore.milvus.client.ca-pem-path |
TLS 双向认证的 ca.pem 路径,仅在 “secure” 为 true 时生效。 | - |
spring.ai.vectorstore.milvus.client.server-pem-path |
TLS 单向认证的 server.pem 路径,仅在 “secure” 为 true 时生效。 | - |
spring.ai.vectorstore.milvus.client.server-name |
设置用于 SSL 主机名检查的目标名称覆盖,仅在 “secure” 为 True 时生效。注意:此值传递给 grpc.ssl_target_name_override。 | - |
spring.ai.vectorstore.milvus.client.secure |
保护此连接的授权,设置为 True 以启用 TLS。 | false |
spring.ai.vectorstore.milvus.client.idle-timeout-ms |
客户端通道的空闲超时值(毫秒)。超时值必须大于零。 | 24h |
spring.ai.vectorstore.milvus.client.username |
此连接的用户名。 | root |
spring.ai.vectorstore.milvus.client.password |
此连接的密码。 | milvus |
启动 Milvus 存储
在 src/test/resources/
目录下运行:
docker-compose up
清理环境:
docker-compose down; rm -Rf ./volumes
然后向量存储连接地址:http://localhost:19530, 管理地址:http://localhost:9001 (用户:minioadmin
,传递:minioadmin
)
故障排除
如果 Docker 报告资源问题,请执行:
docker system prune --all --force --volumes
访问原生客户端
Milvus 向量存储实现通过 getNativeClient () 方法提供了对底层原生 Milvus 客户端(MilvusServiceClient)的访问:
MilvusVectorStore vectorStore = context.getBean(MilvusVectorStore.class);
Optional<MilvusServiceClient> nativeClient = vectorStore.getNativeClient();
if (nativeClient.isPresent()) {
MilvusServiceClient client = nativeClient.get();
// Use the native client for Milvus-specific operations
}
原生客户端让您能够访问可能未通过 VectorStore 接口公开的 Milvus 特定功能和操作。
最后编辑:Jeebiz 更新时间:2025-09-28 09:15