OpenAI Transcriptions
Spring AI 支持 OpenAI 的转录模型 。
前提条件(Prerequisites)
- 你需要使用 OpenAI 创建一个 API 来访问 ChatGPT 模型。
- 在 OpenAI 注册页面创建一个账户,并在 API Keys 页面生成令牌。
- Spring AI 项目定义了一个名为 spring.ai.openai.api-key 的配置属性,你应该将其设置为从 openai.com 获取的 API Key 的值。
可以在 application.properties 文件中设置这个配置属性:
spring.ai.openai.api-key=<your-openai-api-key>
为了提高处理 API 密钥等敏感信息时的安全性,可以使用 Spring 表达式语言 (SpEL) 来引用自定义环境变量:
# In application.yml
spring:
ai:
openai:
api-key: ${OPENAI_API_KEY}
# In your environment or .env file
export OPENAI_API_KEY=<your-openai-api-key>
您还可以在 application 代码中以编程方式设置这个配置属性:
// Retrieve API key from a secure source or environment variable
String apiKey = System.getenv("OPENAI_API_KEY");
添加存储库和 BOM
Spring AI 工件发布在 Spring Milestone
和 Snapshot
存储库中。请参阅存储库部分将这些存储库添加到您的构建系统中。
为了帮助进行依赖管理,Spring AI 提供了 BOM(物料清单),以确保在整个项目中使用一致的 Spring AI 版本。请参阅依赖管理部分将 Spring AI BOM 添加到您的构建系统。
自动配置(Auto-configuration)
Spring AI 为 OpenAI 嵌入模型提供了 Spring Boot 自动配置。要启用它,请将以下依赖项添加到项目的 Maven pom.xml
文件中:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>
或者,在你的 Gradle 构建文件 build.gradle
中添加:
dependencies {
implementation 'org.springframework.ai:spring-ai-starter-model-openai'
}
图像生成属性(Image Generation Properties)
Retry 属性(Retry Properties)
前缀 spring.ai.retry
用作属性前缀,允许您为 OpenAI 模型配置 retry 机制。
属性 | 描述 | 默认值 |
---|---|---|
spring.ai.retry.max-attempts |
最大重试次数。 | 10 |
spring.ai.retry.backoff.initial-interval |
指数退避策略的初始睡眠持续时间。 | 2 sec. |
spring.ai.retry.backoff.multiplier |
退避间隔乘数。 | 5 |
spring.ai.retry.backoff.max-interval |
最大退避持续时间。 | 3 min. |
spring.ai.retry.on-client-errors |
如果为false,抛出NonTransientAiException,并且不会对4xx 客户端错误码进行重试。 |
false |
spring.ai.retry.exclude-on-http-codes |
不应触发重试的HTTP状态码列表(例如抛出NonTransientAiException)。 | empty |
spring.ai.retry.on-http-codes |
应触发重试的HTTP状态码列表(例如抛出TransientAiException)。 | empty |
连接属性(Connection Properties)
前缀是 spring.ai.openai
的属性,用于配置 OpenAI 的链接。
属性 | 描述 | 默认值 |
---|---|---|
spring.ai.openai.base-url | 连接的URL地址 | https://api.openai.com |
spring.ai.openai.api-key | API密钥 | - |
spring.ai.openai.organization-id | (可选)可指定用于API请求的组织ID | - |
spring.ai.openai.project-id | (可选)可指定用于API请求的项目ID | - |
配置属性(Configuration Properties)
前缀是 spring.ai.model.audio.transcription
是用于配置 OpenAI 的 转录模型的属性前缀。
属性 | 描述 | 默认值 |
---|---|---|
spring.ai.model.audio.transcription | 启用OpenAI语音转录模型 | openai |
spring.ai.openai.audio.transcription.base-url | 连接URL地址 | api.openai.com |
spring.ai.openai.audio.transcription.api-key | API密钥 | - |
spring.ai.openai.audio.transcription.organization-id | 可选配置,指定用于API请求的组织ID | - |
spring.ai.openai.audio.transcription.project-id | 可选配置,指定用于API请求的项目ID | - |
spring.ai.openai.audio.transcription.options.model | 使用的模型ID(目前仅支持whisper-1,基于开源Whisper V2模型) | whisper-1 |
spring.ai.openai.audio.transcription.options.response-format | 转录输出格式(json、text、srt、verbose_json或vtt) | json |
spring.ai.openai.audio.transcription.options.prompt | 可选文本,用于指导模型风格或继续之前的音频片段(应与音频语言匹配) | |
spring.ai.openai.audio.transcription.options.language | 输入音频的语言(以ISO-639-1格式提供可提高准确性和降低延迟) | |
spring.ai.openai.audio.transcription.options.temperature | 采样温度(0-1),值越高输出越随机,值越低越专注和确定。设为0时模型使用对数概率自动调整温度 | 0 |
spring.ai.openai.audio.transcription.options.timestamp_granularities | 时间戳粒度(word或segment),response_format必须为verbose_json。词级时间戳会产生额外延迟 | segment |
运行时选项(Runtime Options )
OpenAiAudioTranscriptionOptions
类提供了进行转录时可使用的选项。启动时,会应用由 spring.ai.openai.audio.transcription 指定的选项,但您可以在运行时覆盖这些设置。
示例:
OpenAiAudioApi.TranscriptResponseFormat responseFormat = OpenAiAudioApi.TranscriptResponseFormat.VTT;
OpenAiAudioTranscriptionOptions transcriptionOptions = OpenAiAudioTranscriptionOptions.builder()
.language("en")
.prompt("Ask not this, but ask that")
.temperature(0f)
.responseFormat(this.responseFormat)
.build();
AudioTranscriptionPrompt transcriptionRequest = new AudioTranscriptionPrompt(audioFile, this.transcriptionOptions);
AudioTranscriptionResponse response = openAiTranscriptionModel.call(this.transcriptionRequest);
手动配置(Manual Configuration)
OpenAiChatModel 实现了 ChatModel 和 StreamingChatModel, 并使用低级 OpenAiApi 客户端连接 OpenAI 服务。
要启用它,添加 spring-ai-openai
依赖到你的项目 Maven pom.xml
文件:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-openai</artifactId>
</dependency>
或者,在你的 Gradle 构建文件 build.gradle
中添加:
dependencies {
implementation 'org.springframework.ai:spring-ai-openai'
}
接下来,创建一个 OpenAiAudioTranscriptionModel
实例:
var openAiAudioApi = new OpenAiAudioApi(System.getenv("OPENAI_API_KEY"));
var openAiAudioTranscriptionModel = new OpenAiAudioTranscriptionModel(this.openAiAudioApi);
var transcriptionOptions = OpenAiAudioTranscriptionOptions.builder()
.responseFormat(TranscriptResponseFormat.TEXT)
.temperature(0f)
.build();
var audioFile = new FileSystemResource("/path/to/your/resource/speech/jfk.flac");
AudioTranscriptionPrompt transcriptionRequest = new AudioTranscriptionPrompt(this.audioFile, this.transcriptionOptions);
AudioTranscriptionResponse response = openAiTranscriptionModel.call(this.transcriptionRequest);
最后编辑:Jeebiz 更新时间:2025-08-31 23:07