文档地址:https://platform.openai.com/docs/models/moderation

概述

OpenAI API 由具有不同功能和价格点的多种模型提供支持。您还可以通过微调针对您的特定用例对我们的模型进行自定义。

模型 描述
GPT-4 和 GPT-4 Turbo 一组改进 GPT-3.5 的模型,可以理解并生成自然语言或代码
GPT-3.5 一组改进 GPT-3 的模型,可以理解并生成自然语言或代码
DALL·E 可以在自然语言提示下生成和编辑图像的模型
TTS 一组可以将文本转换为听起来自然的语音的模型
Whisper 可以将音频转换为文本的模型
Embeddings 一组可以将文本转换为数字形式的模型
Moderation 可以检测文本是否敏感或不安全的微调模型
GPT base 一组无需遵循指令即可理解并生成自然语言或代码的模型
GPT-3 Legacy 一组能够理解和生成自然语言的模型
Deprecated 已弃用的型号的完整列表以及建议的替代品

我们还发布了开源模型,包括 Point-EWhisperJukeboxCLIP

访问我们的研究人员模型索引进行学习 详细了解我们的研究论文中介绍了哪些模型以及差异 InstructGPT 和 GPT-3.5 等模型系列之间。

型号持续升级

gpt-3.5-turbogpt-4gpt-4-32k 指向最新的模型版本。您可以在发送请求后通过查看响应对象来验证这一点。响应将包括所使用的特定模型版本(例如gpt-3.5-turbo-0613)

我们还提供静态模型版本,开发人员可以在引入更新模型后继续使用至少三个月。随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们针对不同用例改进模型。如果您有兴趣,请查看OpenAI Evals存储库。

以下型号是临时快照,我们已经宣布了其弃用日期及其替换日期。如果您想使用最新的型号版本,请使用标准型号名称,例如 gpt-4gpt-3.5-turbo

型号名称 停产日期 更换型号
gpt-3.5-turbo-0613 2024 年 6 月 13 日 gpt-3.5-turbo-1106
gpt-3.5-turbo-0301 2024 年 6 月 13 日 gpt-3.5-turbo-1106
gpt-4-0314 2024 年 6 月 13 日 gpt-4-0613
gpt-4-32k-0314 2024 年 6 月 13 日 gpt-4-32k-0613

GPT-4 和 GPT-4 Turbo

GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。 GPT-4 在 OpenAI API 中可供付费客户使用。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于使用 Chat Completions API 的传统完成任务。在我们的GPT 指南中了解如何使用 GPT-4。

模型 描述 上下文窗口 训练数据
gpt-4-1106-preview GPT-4 Turbo
最新的 GPT-4 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。此预览模型尚不适合生产流量。
128,000 tokens 截至 2023 年 4 月
gpt-4-vision-preview GPT-4 Turbo
除了所有其他 GPT-4 Turbo 功能之外,还能够理解图像。最多返回 4,096 个输出标记。这是预览模型版本,尚不适合生产流量。
128,000 tokens 截至 2023 年 4 月
GPT-4 当前指向 gpt-4-0613。请参阅持续模型升级。 8,192 tokens 截至 2021 年 9 月
gpt-4-32k 当前指向gpt-4-32k-0613。请参阅持续模型升级。 32,768 tokens
GPT-4-0613 2023 年 6 月 13 日的快照gpt-4,改进了函数调用支持。 8,192 tokens 截至 2021 年 9 月
GPT-4-32K-0613 2023 年 6 月 13 日的快照gpt-4-32k,改进了函数调用支持。 32,768 tokens 截至 2021 年 9 月
GPT-4-0314 Legacy 2023 年 3 月 14 日的快照gpt-4,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。 8,192 tokens 截至 2021 年 9 月
GPT-4-32K-0314 Legacy 2023 年 3 月 14 日的快照gpt-4-32k,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。 32,768 tokens 截至 2021 年 9 月

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都要强大得多。

多语言能力

GPT-4 优于之前的大型语言模型并且截至 2023 年,大多数最先进的系统(通常具有针对特定基准的培训或手工设计)。在 MMLU 基准测试(涵盖 57 个科目的英语多项选择题套件)上,GPT-4 不仅在英语方面大幅优于现有模型,而且在其他语言方面也表现出了强劲的表现。

GPT-3.5

GPT-3.5 模型可以理解并生成自然语言或代码。我们 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo,它已使用 Chat Completions API

模型 描述 上下文窗口 训练数据
gpt-3.5-turbo-1106 更新了 GPT 3.5 Turbo
最新的 GPT-3.5 Turbo 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。
16,385 tokens 截至 2021 年 9 月
gpt-3.5-turbo 当前指向gpt-3.5-turbo-0613 4,096 tokens 截至 2021 年 9 月
gpt-3.5-turbo-16k 当前指向 gpt-3.5-turbo-0613 16,385 tokens 截至 2021 年 9 月
gpt-3.5-turbo-instruct 与text-davinci-003类似的功能,但与旧版完成端点兼容,但与聊天完成端点兼容。 4,096 tokens 截至 2021 年 9 月
gpt-3.5-turbo-0613 Legacy 2023 年 6 月 13 日的 gpt-3.5-turbo 快照。将于 2024 年 6 月 13 日弃用。 4,096 tokens 截至 2021 年 9 月
gpt-3.5-turbo-16k-0613 Legacy 2023 年 6 月 13 日的 gpt-3.5-16k-turbo 快照。将于 2024 年 6 月 13 日弃用。 16,385 tokens 截至 2021 年 9 月
gpt-3.5-turbo-0301 Legacy 2023 年 3 月 1 日的 gpt-3.5-turbo 快照。将于 2024 年 6 月 13 日弃用。 4,096 tokens 截至 2021 年 9 月
text-davinci-003 Legacy 能够以比居里、巴贝奇或 ada 模型更好的质量和一致性完成语言任务。将于 2024 年 1 月 4 日弃用。 4,096 tokens 截至 2021 年 9 月
text-davinci-002 Legacy 与text-davinci-003类似的功能,但通过监督微调而不是强化学习进行训练。将于 2024 年 1 月 4 日弃用。 4,096 tokens 截至 2021 年 6 月
code-davinci-002 Legacy 针对代码完成任务进行了优化。将于 2024 年 1 月 4 日弃用。 8001 tokens 截至 2021 年 6 月

我们建议使用gpt-3.5-turbo而不是其他 GPT-3.5 模型,因为它的成本更低且性能更高。

DALL·E

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。 DALL·E 3 目前支持根据提示创建具有特定尺寸的新图像的功能。DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。

DALL·E 3 可通过我们的 Images API 以及 DALL·E 2。您可以通过ChatGPT Plus 尝试DALL·E 3。

模型 描述
dall-e-3 2023 年 11 月发布的最新 DALL·E 型号。
dall-e-2 DALL·E 于 2022 年 11 月之前发布的模型 。DALL·E 的第二次迭代具有比原始模型更真实、更准确且分辨率提高 4 倍的图像。

TTS

TTS 是一种 AI 模型,可将文本转换为听起来自然的口语文本。我们提供两种不同的模型变量,tts-1 针对实时文本转语音用例进行了优化,tts-1-hd 针对质量进行了优化。这些模型可与音频 API 中的语音端点结合使用。

模型 描述
tts-1 文字转语音1新的
最新的文本转语音模型,针对速度进行了优化。
tts-1-hd 文字转语音 1 高清新的
最新的文本转语音模型,针对质量进行了优化。

Whisper

Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用 whisper-1 模型名称获取。

目前,Whisper 开源版本与通过我们的 API 提供的版本没有区别。但是,通过我们的 API,我们提供了优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。

Embeddings

Embeddings是文本的数字表示,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务很有用。您可以在公告博客文章中详细了解我们最新的嵌入模型。

Moderation

审核模型旨在检查内容是否符合 OpenAI 使用政策。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。您可以在我们的审核指南中了解更多信息。

审核模型接受任意大小的输入,该输入会自动分解为 4,096 个令牌的块。如果输入超过 32,768 个令牌,则会使用截断,在极少数情况下,可能会在审核检查中省略少量令牌。

每个对审核端点的请求的最终结果显示每个类别的最大值。例如,如果一块 4K 令牌的类别分数为 0.9901,另一块的分数为 0.1901,则结果将在 API 响应中显示 0.9901,因为它更高。

模型 描述 最大tokens
text-moderation-latest 最有能力的审核模型。准确度会比稳定模型略高 32,768
text-moderation-stable 几乎与最新型号一样功能,但稍旧 32,768

GPT base

GPT base 模型可以理解并生成自然语言或代码,但未接受以下指令的训练。这些模型旨在替代我们原来的 GPT-3 基本模型,并使用旧版 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。

模型 描述 最大tokens 训练数据
babbage-002 GPT-3 的替代品ada 和babbage 基本型号。 6,384 tokens 截至 2021 年 9 月
davinci-002 GPT-3 的替代品curie 和davinci 基本型号。 6,384 tokens 截至 2021 年 9 月

GPT-3 Legacy

GPT-3 模型可以理解并生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始 GPT-3 基本模型(davinci、curie、ada 和 babbage )是当前唯一可进行微调的模型。

模型 描述 最大tokens 训练数据
text-curie-001 比达芬奇能力更强、速度更快、成本更低。 2,049 tokens 截至 2019 年 10 月
text-babbage-001 能够完成简单的任务、速度非常快且成本较低。 2,049 tokens 截至 2019 年 10 月
text-ada-001 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。 2,049 tokens 截至 2019 年 10 月
davinci 最有能力的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且质量通常更高。 2,049 tokens 截至 2019 年 10 月
curie 非常有能力,但比达芬奇更快、成本更低。 2,049 tokens 截至 2019 年 10 月
babbage 能够完成简单的任务、速度非常快且成本较低。 2,049 tokens 截至 2019 年 10 月
ada 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。 2,049 tokens 截至 2019 年 10 月
作者:Jeebiz  创建时间:2023-12-17 00:05
最后编辑:Jeebiz  更新时间:2023-12-28 16:43