Milvus

Milvus 是一款开源的向量数据库,在数据科学和机器学习领域引起了广泛关注。其显著特点之一在于对向量索引与查询的强大支持。Milvus 采用最前沿的尖端算法加速搜索过程,使其在处理大规模数据集时,也能异常高效地检索相似向量。

先决条件

  • 运行 Milvus 实例。可以使用以下选项:
  • 如果需要, 可以给 EmbeddingClient 配置 API 密钥,生成嵌入结果并通过 MilvusVectorStore存储.

依赖项

然后将 Milvus VectorStore 启动器依赖项添加到您的项目中:

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-vector-store-milvus</artifactId>
</dependency>

或者,在你的 Gradle 构建文件 build.gradle 中添加:

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-vector-store-milvus'
}

向量存储的实现可以为您初始化所需的架构,但您必须通过指定构造函数中的 initializeSchema 布尔值或在 application.properties 文件中设置 initialize-schema=true 来选择启用。

要连接到并配置MilvusVectorStore,您需要提供实例的访问详细信息。可以通过 Spring Boot 提供简单的配置 application.yml

spring:
    ai:
        vectorstore:
            milvus:
                client:
                    host: "localhost"
                    port: 19530
                    username: "root"
                    password: "milvus"
                databaseName: "default"
                collectionName: "vector_store"
                embeddingDimension: 1536
                indexType: IVF_FLAT
                metricType: COSINE

现在您可以在应用程序中自动连接 Milvus Vector Store 并使用它

@Autowired VectorStore vectorStore;

// ...

List <Document> documents = List.of(
    new Document("Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!!", Map.of("meta1", "meta1")),
    new Document("The World is Big and Salvation Lurks Around the Corner"),
    new Document("You walk forward facing the past and you turn back toward the future.", Map.of("meta2", "meta2")));

// Add the documents to Milvus Vector Store
vectorStore.add(documents);

// Retrieve documents similar to a query
List<Document> results = this.vectorStore.similaritySearch(SearchRequest.builder().query("Spring").topK(5).build());

手动配置

不使用 Spring Boot 的自动配置,您可以手动配置 MilvusVectorStore。将以下依赖项添加到您的项目中:

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-milvus-store</artifactId>
</dependency>

要在您的应用程序中配置 MilvusVectorStore,可以使用以下设置:

    @Bean
    public VectorStore vectorStore(MilvusServiceClient milvusClient, EmbeddingModel embeddingModel) {
        return MilvusVectorStore.builder(milvusClient, embeddingModel)
                .collectionName("test_vector_store")
                .databaseName("default")
                .indexType(IndexType.IVF_FLAT)
                .metricType(MetricType.COSINE)
                .batchingStrategy(new TokenCountBatchingStrategy())
                .initializeSchema(true)
                .build();
    }

    @Bean
    public MilvusServiceClient milvusClient() {
        return new MilvusServiceClient(ConnectParam.newBuilder()
            .withAuthorization("minioadmin", "minioadmin")
            .withUri(milvusContainer.getEndpoint())
            .build());
    }

元数据过滤

您可以在 Milvus 存储中使用通用的、可移植的 元数据过滤器

例如,您可以使用文本表达式语言:

vectorStore.similaritySearch(
    SearchRequest.builder()
    .query("The World")
    .topK(TOP_K)
    .similarityThreshold(SIMILARITY_THRESHOLD)
    .filterExpression("author in ['john', 'jill'] && article_type == 'blog'").build());

或通过编程方式使用 Filter.Expression DSL

FilterExpressionBuilder b = new FilterExpressionBuilder();

vectorStore.similaritySearch(SearchRequest.builder()
    .query("The World")
    .topK(TOP_K)
    .similarityThreshold(SIMILARITY_THRESHOLD)
    .filterExpression(b.and(
        b.in("author","john", "jill"),
        b.eq("article_type", "blog")).build()).build());

使用 MilvusSearchRequest

MilvusSearchRequest 继承自 SearchRequest,使您能够使用 Milvus 特有的搜索参数,如原生表达式和搜索参数 JSON。

MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
    .query("sample query")
    .topK(5)
    .similarityThreshold(0.7)
    .nativeExpression("metadata[\"age\"] > 30") // Overrides filterExpression if both are set
    .filterExpression("age <= 30") // Ignored if nativeExpression is set
    .searchParamsJson("{\"nprobe\":128}")
    .build();
List results = vectorStore.similaritySearch(request);

原生表达式与搜索参数 JSON 在 MilvusSearchRequest 中的重要性

这两个参数提升了 Milvus 搜索的精确度,并确保了查询性能的最优化。

NativeExpression:启用使用 Milvus 原生过滤表达式进行额外过滤的功能。Milvus 过滤

示例:

MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
    .query("sample query")
    .topK(5)
    .nativeExpression("metadata['category'] == 'science'")
    .build();

SearchParamsJson:在使用 Milvus 默认索引 IVF_FLAT 时,用于调优搜索行为的关键参数。Milvus 向量索引

默认情况下,IVF_FLAT 需要设置 nprobe 以确保结果准确。如果未指定,nprobe 默认为 1,这可能导致召回率低甚至搜索结果为零。

示例:

MilvusSearchRequest request = MilvusSearchRequest.milvusBuilder()
    .query("sample query")
    .topK(5)
    .searchParamsJson("{\"nprobe\":128}")
    .build();

使用原生表达式(nativeExpression)能确保高级过滤,而搜索参数 JSON(searchParamsJson)则避免了因默认 nprobe 值过低导致的搜索效率低下问题。

Milvus 向量存储属性

您可以在 Spring Boot 配置中使用以下属性来定制 Milvus 向量存储。

属性 (Property) 描述 (Description) 默认值 (Default value)
spring.ai.vectorstore.milvus.database-name 要使用的 Milvus 数据库名称。 default
spring.ai.vectorstore.milvus.collection-name 用于存储向量的 Milvus 集合 (Collection) 名称。 vector_store
spring.ai.vectorstore.milvus.initialize-schema 是否初始化 Milvus 的后端模式 (Schema)。 false
spring.ai.vectorstore.milvus.embedding-dimension 要存储在 Milvus 集合中的向量的维度。 1536
spring.ai.vectorstore.milvus.index-type 要为 Milvus 集合创建的索引类型。 IVF_FLAT
spring.ai.vectorstore.milvus.metric-type 用于 Milvus 集合的距离度量类型。 COSINE (余弦)
spring.ai.vectorstore.milvus.index-parameters 用于 Milvus 集合的索引参数。 {"nlist":1024}
spring.ai.vectorstore.milvus.id-field-name 集合的 ID 字段名称。 doc_id
spring.ai.vectorstore.milvus.auto-id 布尔标志,指示 ID 字段是否使用自动生成 ID。 false
spring.ai.vectorstore.milvus.content-field-name 集合的内容字段名称。 content
spring.ai.vectorstore.milvus.metadata-field-name 集合的元数据字段名称。 metadata
spring.ai.vectorstore.milvus.embedding-field-name 集合的嵌入向量字段名称。 embedding
spring.ai.vectorstore.milvus.client.host 主机的主机名或地址。 localhost
spring.ai.vectorstore.milvus.client.port 连接端口。 19530
spring.ai.vectorstore.milvus.client.uri Milvus 实例的 URI。 -
spring.ai.vectorstore.milvus.client.token 用作识别和认证密钥的令牌 (Token)。 -
spring.ai.vectorstore.milvus.client.connect-timeout-ms 客户端通道的连接超时值(毫秒)。超时值必须大于零。 10000
spring.ai.vectorstore.milvus.client.keep-alive-time-ms 客户端通道的保持活动时间值(毫秒)。保持活动值必须大于零。 55000
spring.ai.vectorstore.milvus.client.keep-alive-timeout-ms 客户端通道的保持活动超时值(毫秒)。超时值必须大于零。 20000
spring.ai.vectorstore.milvus.client.rpc-deadline-ms 等待服务器回复的最后期限(毫秒)。设置此值后,客户端在遇到由网络波动引起的快速 RPC 失败时会等待。最后期限值必须大于或等于零。 0
spring.ai.vectorstore.milvus.client.client-key-path TLS 双向认证的 client.key 路径,仅在 “secure” 为 true 时生效。 -
spring.ai.vectorstore.milvus.client.client-pem-path TLS 双向认证的 client.pem 路径,仅在 “secure” 为 true 时生效。 -
spring.ai.vectorstore.milvus.client.ca-pem-path TLS 双向认证的 ca.pem 路径,仅在 “secure” 为 true 时生效。 -
spring.ai.vectorstore.milvus.client.server-pem-path TLS 单向认证的 server.pem 路径,仅在 “secure” 为 true 时生效。 -
spring.ai.vectorstore.milvus.client.server-name 设置用于 SSL 主机名检查的目标名称覆盖,仅在 “secure” 为 True 时生效。注意:此值传递给 grpc.ssl_target_name_override。 -
spring.ai.vectorstore.milvus.client.secure 保护此连接的授权,设置为 True 以启用 TLS。 false
spring.ai.vectorstore.milvus.client.idle-timeout-ms 客户端通道的空闲超时值(毫秒)。超时值必须大于零。 24h
spring.ai.vectorstore.milvus.client.username 此连接的用户名。 root
spring.ai.vectorstore.milvus.client.password 此连接的密码。 milvus

启动 Milvus 存储

src/test/resources/ 目录下运行:

docker-compose up

清理环境:

docker-compose down; rm -Rf ./volumes

然后向量存储连接地址:http://localhost:19530, 管理地址:http://localhost:9001 (用户:minioadmin,传递:minioadmin

故障排除

如果 Docker 报告资源问题,请执行:

docker system prune --all --force --volumes

访问原生客户端

Milvus 向量存储实现通过 getNativeClient () 方法提供了对底层原生 Milvus 客户端(MilvusServiceClient)的访问:

MilvusVectorStore vectorStore = context.getBean(MilvusVectorStore.class);
Optional<MilvusServiceClient> nativeClient = vectorStore.getNativeClient();

if (nativeClient.isPresent()) {
    MilvusServiceClient client = nativeClient.get();
    // Use the native client for Milvus-specific operations
}

原生客户端让您能够访问可能未通过 VectorStore 接口公开的 Milvus 特定功能和操作。

作者:Jeebiz  创建时间:2025-08-03 12:05
最后编辑:Jeebiz  更新时间:2025-09-28 09:15