文档地址:https://platform.openai.com/docs/models/moderation
概述
OpenAI API 由具有不同功能和价格点的多种模型提供支持。您还可以通过微调针对您的特定用例对我们的模型进行自定义。
模型 | 描述 |
---|---|
GPT-4 和 GPT-4 Turbo | 一组改进 GPT-3.5 的模型,可以理解并生成自然语言或代码 |
GPT-3.5 | 一组改进 GPT-3 的模型,可以理解并生成自然语言或代码 |
DALL·E | 可以在自然语言提示下生成和编辑图像的模型 |
TTS | 一组可以将文本转换为听起来自然的语音的模型 |
Whisper | 可以将音频转换为文本的模型 |
Embeddings | 一组可以将文本转换为数字形式的模型 |
Moderation | 可以检测文本是否敏感或不安全的微调模型 |
GPT base | 一组无需遵循指令即可理解并生成自然语言或代码的模型 |
GPT-3 Legacy | 一组能够理解和生成自然语言的模型 |
Deprecated | 已弃用的型号的完整列表以及建议的替代品 |
我们还发布了开源模型,包括 Point-E
、Whisper
、Jukebox
和 CLIP
。
访问我们的研究人员模型索引进行学习 详细了解我们的研究论文中介绍了哪些模型以及差异 InstructGPT 和 GPT-3.5 等模型系列之间。
型号持续升级
gpt-3.5-turbo
、gpt-4
和 gpt-4-32k
指向最新的模型版本。您可以在发送请求后通过查看响应对象来验证这一点。响应将包括所使用的特定模型版本(例如gpt-3.5-turbo-0613)。
我们还提供静态模型版本,开发人员可以在引入更新模型后继续使用至少三个月。随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们针对不同用例改进模型。如果您有兴趣,请查看OpenAI Evals存储库。
以下型号是临时快照,我们已经宣布了其弃用日期及其替换日期。如果您想使用最新的型号版本,请使用标准型号名称,例如 gpt-4
或 gpt-3.5-turbo
。
型号名称 | 停产日期 | 更换型号 |
---|---|---|
gpt-3.5-turbo-0613 | 2024 年 6 月 13 日 | gpt-3.5-turbo-1106 |
gpt-3.5-turbo-0301 | 2024 年 6 月 13 日 | gpt-3.5-turbo-1106 |
gpt-4-0314 | 2024 年 6 月 13 日 | gpt-4-0613 |
gpt-4-32k-0314 | 2024 年 6 月 13 日 | gpt-4-32k-0613 |
GPT-4 和 GPT-4 Turbo
GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。 GPT-4 在 OpenAI API 中可供付费客户使用。与
gpt-3.5-turbo
一样,GPT-4 针对聊天进行了优化,但也适用于使用 Chat Completions API 的传统完成任务。在我们的GPT 指南中了解如何使用 GPT-4。
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
gpt-4-1106-preview | GPT-4 Turbo 最新的 GPT-4 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。此预览模型尚不适合生产流量。 |
128,000 tokens | 截至 2023 年 4 月 |
gpt-4-vision-preview | GPT-4 Turbo 除了所有其他 GPT-4 Turbo 功能之外,还能够理解图像。最多返回 4,096 个输出标记。这是预览模型版本,尚不适合生产流量。 |
128,000 tokens | 截至 2023 年 4 月 |
GPT-4 | 当前指向 gpt-4-0613。请参阅持续模型升级。 | 8,192 tokens | 截至 2021 年 9 月 |
gpt-4-32k | 当前指向gpt-4-32k-0613。请参阅持续模型升级。 | 32,768 tokens | |
GPT-4-0613 | 2023 年 6 月 13 日的快照gpt-4,改进了函数调用支持。 | 8,192 tokens | 截至 2021 年 9 月 |
GPT-4-32K-0613 | 2023 年 6 月 13 日的快照gpt-4-32k,改进了函数调用支持。 | 32,768 tokens | 截至 2021 年 9 月 |
GPT-4-0314 Legacy |
2023 年 3 月 14 日的快照gpt-4,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。 | 8,192 tokens | 截至 2021 年 9 月 |
GPT-4-32K-0314 Legacy |
2023 年 3 月 14 日的快照gpt-4-32k,支持函数调用。此模型版本将于 2024 年 6 月 13 日弃用。 | 32,768 tokens | 截至 2021 年 9 月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都要强大得多。
多语言能力
GPT-4 优于之前的大型语言模型并且截至 2023 年,大多数最先进的系统(通常具有针对特定基准的培训或手工设计)。在 MMLU 基准测试(涵盖 57 个科目的英语多项选择题套件)上,GPT-4 不仅在英语方面大幅优于现有模型,而且在其他语言方面也表现出了强劲的表现。
GPT-3.5
GPT-3.5 模型可以理解并生成自然语言或代码。我们 GPT-3.5 系列中功能最强大且最具成本效益的模型是
gpt-3.5-turbo
,它已使用 Chat Completions API
模型 | 描述 | 上下文窗口 | 训练数据 |
---|---|---|---|
gpt-3.5-turbo-1106 | 更新了 GPT 3.5 Turbo 最新的 GPT-3.5 Turbo 模型具有改进的指令跟踪、JSON 模式、可重现的输出、并行函数调用等。最多返回 4,096 个输出标记。 |
16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo | 当前指向gpt-3.5-turbo-0613 | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-16k | 当前指向 gpt-3.5-turbo-0613 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-instruct | 与text-davinci-003类似的功能,但与旧版完成端点兼容,但与聊天完成端点兼容。 | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-0613 Legacy |
2023 年 6 月 13 日的 gpt-3.5-turbo 快照。将于 2024 年 6 月 13 日弃用。 | 4,096 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-16k-0613 Legacy |
2023 年 6 月 13 日的 gpt-3.5-16k-turbo 快照。将于 2024 年 6 月 13 日弃用。 | 16,385 tokens | 截至 2021 年 9 月 |
gpt-3.5-turbo-0301 Legacy |
2023 年 3 月 1 日的 gpt-3.5-turbo 快照。将于 2024 年 6 月 13 日弃用。 | 4,096 tokens | 截至 2021 年 9 月 |
text-davinci-003 Legacy |
能够以比居里、巴贝奇或 ada 模型更好的质量和一致性完成语言任务。将于 2024 年 1 月 4 日弃用。 | 4,096 tokens | 截至 2021 年 9 月 |
text-davinci-002 Legacy |
与text-davinci-003类似的功能,但通过监督微调而不是强化学习进行训练。将于 2024 年 1 月 4 日弃用。 | 4,096 tokens | 截至 2021 年 6 月 |
code-davinci-002 Legacy |
针对代码完成任务进行了优化。将于 2024 年 1 月 4 日弃用。 | 8001 tokens | 截至 2021 年 6 月 |
我们建议使用gpt-3.5-turbo而不是其他 GPT-3.5 模型,因为它的成本更低且性能更高。
DALL·E
DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。
DALL·E 3
目前支持根据提示创建具有特定尺寸的新图像的功能。DALL·E 2
还支持编辑现有图像或创建用户提供的图像的变体的功能。
DALL·E 3 可通过我们的 Images API 以及 DALL·E 2。您可以通过ChatGPT Plus 尝试DALL·E 3。
模型 | 描述 |
---|---|
dall-e-3 | 2023 年 11 月发布的最新 DALL·E 型号。 |
dall-e-2 | DALL·E 于 2022 年 11 月之前发布的模型 。DALL·E 的第二次迭代具有比原始模型更真实、更准确且分辨率提高 4 倍的图像。 |
TTS
TTS 是一种 AI 模型,可将文本转换为听起来自然的口语文本。我们提供两种不同的模型变量,
tts-1
针对实时文本转语音用例进行了优化,tts-1-hd
针对质量进行了优化。这些模型可与音频 API 中的语音端点结合使用。
模型 | 描述 |
---|---|
tts-1 | 文字转语音1新的 最新的文本转语音模型,针对速度进行了优化。 |
tts-1-hd | 文字转语音 1 高清新的 最新的文本转语音模型,针对质量进行了优化。 |
Whisper
Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用
whisper-1
模型名称获取。
目前,Whisper 开源版本与通过我们的 API 提供的版本没有区别。但是,通过我们的 API,我们提供了优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。
Embeddings
Embeddings是文本的数字表示,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型 text-embedding-ada-002
旨在以一小部分成本取代之前的 16 个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务很有用。您可以在公告博客文章中详细了解我们最新的嵌入模型。
Moderation
审核模型旨在检查内容是否符合 OpenAI 使用政策。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。您可以在我们的审核指南中了解更多信息。
审核模型接受任意大小的输入,该输入会自动分解为 4,096 个令牌的块。如果输入超过 32,768 个令牌,则会使用截断,在极少数情况下,可能会在审核检查中省略少量令牌。
每个对审核端点的请求的最终结果显示每个类别的最大值。例如,如果一块 4K 令牌的类别分数为 0.9901,另一块的分数为 0.1901,则结果将在 API 响应中显示 0.9901,因为它更高。
模型 | 描述 | 最大tokens |
---|---|---|
text-moderation-latest | 最有能力的审核模型。准确度会比稳定模型略高 | 32,768 |
text-moderation-stable | 几乎与最新型号一样功能,但稍旧 | 32,768 |
GPT base
GPT base 模型可以理解并生成自然语言或代码,但未接受以下指令的训练。这些模型旨在替代我们原来的 GPT-3 基本模型,并使用旧版 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。
模型 | 描述 | 最大tokens | 训练数据 |
---|---|---|---|
babbage-002 | GPT-3 的替代品ada 和babbage 基本型号。 | 6,384 tokens | 截至 2021 年 9 月 |
davinci-002 | GPT-3 的替代品curie 和davinci 基本型号。 | 6,384 tokens | 截至 2021 年 9 月 |
GPT-3 Legacy
GPT-3 模型可以理解并生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始 GPT-3 基本模型(davinci、curie、ada 和 babbage )是当前唯一可进行微调的模型。
模型 | 描述 | 最大tokens | 训练数据 |
---|---|---|---|
text-curie-001 | 比达芬奇能力更强、速度更快、成本更低。 | 2,049 tokens | 截至 2019 年 10 月 |
text-babbage-001 | 能够完成简单的任务、速度非常快且成本较低。 | 2,049 tokens | 截至 2019 年 10 月 |
text-ada-001 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。 | 2,049 tokens | 截至 2019 年 10 月 |
davinci | 最有能力的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且质量通常更高。 | 2,049 tokens | 截至 2019 年 10 月 |
curie | 非常有能力,但比达芬奇更快、成本更低。 | 2,049 tokens | 截至 2019 年 10 月 |
babbage | 能够完成简单的任务、速度非常快且成本较低。 | 2,049 tokens | 截至 2019 年 10 月 |
ada | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。 | 2,049 tokens | 截至 2019 年 10 月 |
最后编辑:Jeebiz 更新时间:2023-12-28 16:43