OpenAI - Powered by MinDoc

OpenAI Transcriptions

Spring AI 支持 OpenAI 的转录模型。

前提条件（Prerequisites）

你需要使用 OpenAI 创建一个 API 来访问 ChatGPT 模型。
在 OpenAI 注册页面创建一个账户，并在 API Keys 页面生成令牌。
Spring AI 项目定义了一个名为 spring.ai.openai.api-key 的配置属性，你应该将其设置为从 openai.com 获取的 API Key 的值。

可以在 application.properties 文件中设置这个配置属性：

spring.ai.openai.api-key=<your-openai-api-key>

为了提高处理 API 密钥等敏感信息时的安全性，可以使用 Spring 表达式语言 (SpEL) 来引用自定义环境变量：

# In application.yml
spring:
  ai:
    openai:
      api-key: ${OPENAI_API_KEY}

# In your environment or .env file
export OPENAI_API_KEY=<your-openai-api-key>

您还可以在 application 代码中以编程方式设置这个配置属性：

// Retrieve API key from a secure source or environment variable
String apiKey = System.getenv("OPENAI_API_KEY");

添加存储库和 BOM

Spring AI 工件发布在 Spring Milestone 和 Snapshot 存储库中。请参阅存储库部分将这些存储库添加到您的构建系统中。

为了帮助进行依赖管理，Spring AI 提供了 BOM（物料清单），以确保在整个项目中使用一致的 Spring AI 版本。请参阅依赖管理部分将 Spring AI BOM 添加到您的构建系统。

自动配置（Auto-configuration）

Spring AI 为 OpenAI 嵌入模型提供了 Spring Boot 自动配置。要启用它，请将以下依赖项添加到项目的 Maven pom.xml文件中：

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>

或者，在你的 Gradle 构建文件 build.gradle 中添加：

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-openai'
}

图像生成属性（Image Generation Properties）

Retry 属性（Retry Properties）

前缀 spring.ai.retry 用作属性前缀，允许您为 OpenAI 模型配置 retry 机制。

属性	描述	默认值
`spring.ai.retry.max-attempts`	最大重试次数。	`10`
`spring.ai.retry.backoff.initial-interval`	指数退避策略的初始睡眠持续时间。	`2 sec.`
`spring.ai.retry.backoff.multiplier`	退避间隔乘数。	`5`
`spring.ai.retry.backoff.max-interval`	最大退避持续时间。	`3 min.`
`spring.ai.retry.on-client-errors`	如果为false，抛出NonTransientAiException，并且不会对`4xx`客户端错误码进行重试。	`false`
`spring.ai.retry.exclude-on-http-codes`	不应触发重试的HTTP状态码列表（例如抛出NonTransientAiException）。	`empty`
`spring.ai.retry.on-http-codes`	应触发重试的HTTP状态码列表（例如抛出TransientAiException）。	`empty`

连接属性（Connection Properties）

前缀是 spring.ai.openai 的属性，用于配置 OpenAI 的链接。

属性	描述	默认值
spring.ai.openai.base-url	连接的URL地址	https://api.openai.com
spring.ai.openai.api-key	API密钥	-
spring.ai.openai.organization-id	（可选）可指定用于API请求的组织ID	-
spring.ai.openai.project-id	（可选）可指定用于API请求的项目ID	-

配置属性（Configuration Properties）

前缀是 spring.ai.model.audio.transcription 是用于配置 OpenAI 的转录模型的属性前缀。

属性	描述	默认值
spring.ai.model.audio.transcription	启用OpenAI语音转录模型	openai
spring.ai.openai.audio.transcription.base-url	连接URL地址	`api.openai.com`
spring.ai.openai.audio.transcription.api-key	API密钥	-
spring.ai.openai.audio.transcription.organization-id	可选配置，指定用于API请求的组织ID	-
spring.ai.openai.audio.transcription.project-id	可选配置，指定用于API请求的项目ID	-
spring.ai.openai.audio.transcription.options.model	使用的模型ID(目前仅支持whisper-1，基于开源Whisper V2模型)	whisper-1
spring.ai.openai.audio.transcription.options.response-format	转录输出格式(json、text、srt、verbose_json或vtt)	json
spring.ai.openai.audio.transcription.options.prompt	可选文本，用于指导模型风格或继续之前的音频片段(应与音频语言匹配)
spring.ai.openai.audio.transcription.options.language	输入音频的语言(以ISO-639-1格式提供可提高准确性和降低延迟)
spring.ai.openai.audio.transcription.options.temperature	采样温度(0-1)，值越高输出越随机，值越低越专注和确定。设为0时模型使用对数概率自动调整温度	0
spring.ai.openai.audio.transcription.options.timestamp_granularities	时间戳粒度(word或segment)，response_format必须为verbose_json。词级时间戳会产生额外延迟	segment

运行时选项（Runtime Options ）

OpenAiAudioTranscriptionOptions 类提供了进行转录时可使用的选项。启动时，会应用由 spring.ai.openai.audio.transcription 指定的选项，但您可以在运行时覆盖这些设置。

示例：

OpenAiAudioApi.TranscriptResponseFormat responseFormat = OpenAiAudioApi.TranscriptResponseFormat.VTT;

OpenAiAudioTranscriptionOptions transcriptionOptions = OpenAiAudioTranscriptionOptions.builder()
    .language("en")
    .prompt("Ask not this, but ask that")
    .temperature(0f)
    .responseFormat(this.responseFormat)
    .build();
AudioTranscriptionPrompt transcriptionRequest = new AudioTranscriptionPrompt(audioFile, this.transcriptionOptions);
AudioTranscriptionResponse response = openAiTranscriptionModel.call(this.transcriptionRequest);

手动配置（Manual Configuration）

OpenAiChatModel 实现了 ChatModel 和 StreamingChatModel, 并使用低级 OpenAiApi 客户端连接 OpenAI 服务。

要启用它，添加 spring-ai-openai 依赖到你的项目 Maven pom.xml 文件:

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-openai</artifactId>
</dependency>

或者，在你的 Gradle 构建文件 build.gradle 中添加：

dependencies {
    implementation 'org.springframework.ai:spring-ai-openai'
}

接下来，创建一个 OpenAiAudioTranscriptionModel 实例：

 var openAiAudioApi = new OpenAiAudioApi(System.getenv("OPENAI_API_KEY"));

var openAiAudioTranscriptionModel = new OpenAiAudioTranscriptionModel(this.openAiAudioApi);

var transcriptionOptions = OpenAiAudioTranscriptionOptions.builder()
    .responseFormat(TranscriptResponseFormat.TEXT)
    .temperature(0f)
    .build();

var audioFile = new FileSystemResource("/path/to/your/resource/speech/jfk.flac");

AudioTranscriptionPrompt transcriptionRequest = new AudioTranscriptionPrompt(this.audioFile, this.transcriptionOptions);
AudioTranscriptionResponse response = openAiTranscriptionModel.call(this.transcriptionRequest);

作者：Ddd4j 创建时间：2025-08-08 00:53
最后编辑：Ddd4j 更新时间：2026-04-23 14:31

上一篇： Azure OpenAI
下一篇： Text-To-Speech (TTS) API