微软Azure OpenAI服务是什么?微软Azure OpenAI服务普遍的问题解答
来源:火狐体育网址    发布时间:2024-07-21 02:03:59

  包括但不限于内容生成、汇总、图像理解、语义搜索和自然语言到代码的转换。你能够最终靠 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面访问该服务。

  由于需要应对很高的需求、即将推出的产品改进以及履行Microsoft 对负责任 AI 做出的承诺,我们目前会限制访问。 当前,我们正在与已经同 Microsoft 建立了合作伙伴关系的客户、用例风险较低的客户以及承诺融入缓解措施的客户合作。

  申请表单中包含了更具体的信息。 感谢你们的耐心,我们将努力以负责的态度实现 Azure OpenAI 的更多样化访问方式。

  通过微软官方合作伙伴获取服务,企业用户都能够合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

  作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!

  补全终结点是 API 服务的核心组件。 此 API 提供对模型的文本输入、文本输出接口的访问。 用户只需提供一个包含英文文本命令的输入提示,模型就会生成文本补全。

  Azure OpenAI 通过将文本分解为标记来处理文本。 标记可以是单词,也可以是字符块。 例如,单词“hamburger”将分解为标记“ham”、“bur”和“ger”,而“pear”之类的常见短单词只是一个单个标记。 许多标记以空格开头,例如“ hello”和“ bye”。

  给定请求中处理的标记总数取决于输入、输出和请求参数的长度。 处理的标记数量也会影响模型的响应延迟和吞吐量。

  输入图像的标记成本取决于两个重要的因素:图像的大小以及用于每个图像的细节设置(低或高)。 下面是其工作原理的明细:

  通过低细节,API 可以返回更快的响应,并且对于不需要高细节的用例,能够正常的使用更少的输入标记。

  示例:4096 x 8192 图像(低细节):成本为固定的 85 个标记,因为它是一个低细节图像,并且大小不可能影响此模式下的成本。

  利用高细节,API 能够最终靠将图像裁剪为较小的方块更详细地查看图像。 每个方块可使用更多标记来生成文本。

  首先缩放图像,以适合 2048 x 2048 方形,同时保持其纵横比。

  将图像分为 512 像素方形图块,这些图块(部分图块向上舍入)的数量决定了最终成本。 每个图块的成本为 170 个标记。

  创建 Azure OpenAI 资源后,必须先部署模型,然后才能开始发出 API 调用和生成文本。 能够正常的使用部署 API 来完成此操作。 这些 API 允许指定要使用的模型。

  OpenAI 中的 GPT-3、GPT-3.5 和 GPT-4 模型是基于提示的。 使用基于提示的模型时,用户通过输入文本提示与模型交互,该文本提示通过文本补全进行响应。 补全是模型的输入文本的延续。

  虽然这些模型很强大,但它们的行为对提示也非常敏感。 这使得提示工程成为一项重要的开发技能。

  提示构造可能很困难。 在实践中,提示的作用是配置模型权重以完成所需的任务,但它更像艺术而不是科学,常常要经验和直觉来制作成功的提示。

  DALL-E 模型(有一些为预览版,请参阅模型)基于用户更好的提供的文本提示生成图像。

  Azure OpenAI 不使用客户数据来重新训练模型。 有关详情信息,请参阅Azure OpenAI 数据、隐私和安全指南。

  GPT-4 Turbo 预览版是(1106-preview) 模型。 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“1106-preview”。 若要检查该模型在哪些区域可用,请参阅模型页面。

  是的,作为 Azure AI 服务的一部分,Azure OpenAI 支持 VNET 和专用终结点。 若要了解详情信息,请参阅Azure AI 服务虚拟网络指南。

  否,GPT-4 由 OpenAI 设计为多模式,但目前仅支持文本输入和输出。

  以前,添加新用例的过程要求客户重新应用到服务。 现在,我们将发布一个新流程,允许你快速添加新用例以使用服务。 此过程遵循 Azure AI 服务中既定的受限访问流程。现有客户能在此处证明任何和所有新用例。 注意,每当你想要将服务用于最初未申请的新用例时,都需要这样做。

  我尝试使用嵌入内容时受到错误“InvalidRequestError: 输入太多。 最大输入数为 16。 如何修复此问题?

  尝试发送一批文本以将其作为数组嵌入到单个 API 请求中时,通常会发生此错误。 目前,Azure OpenAI 仅支持具有版本 2 模型的多个输入的嵌入数组。 此模型版本支持每个 API 请求最多包含 16 个输入的数组。 使用 text-embedding-ada-002(版本 2)模型时,数组长度最多可为 8,191 个令牌。

  在哪里能了解使用 Azure OpenAI 从服务获取所需响应的更好方法?

  查看我们的提示工程简介。 虽然这些模型很强大,但它们的行为对从用户处收到的提示也非常敏感。 这使得提示构造成为开发的重要技能。 完成此简介后,请查看关于高级提示工程技术的文章。

  我的来宾帐户已被授予对 Azure OpenAI 资源的访问权限,但我无法在 Azure OpenAI Studio 中访问该资源。 怎么来实现访问?

  或者,如果已从 Azure OpenAI 资源的“概览”窗格中登录到Azure 门户,则可以再一次进行选择“转到 Azure OpenAI Studio”以使用适当的组织上下文自动登录。

  当我问 GPT-4 它正在运行什么模型时,它告诉我正在运行 GPT-3。 为何发生这种情况?

  Azure OpenAI 模型(包括 GPT-4)无法正确识别“正在运行什么模型”是预期行为。

  最终,模型将执行下一个令牌预测来回答你的问题。 该模型没有一点本机功能来查询当前运行的是哪个模型版本,因此无法回答你的问题。 要回答这样的一个问题,始终可以转到 Azure OpenAI Studio “管理”“部署”,然后查阅模型名称列,确认哪个模型当前与给定部署名称相关联。

  “你运行的是哪个模型?”或“OpenAI 的最新模型是什么?”这样的问题与问模型今天天气怎么样所产生的结果的质量差不多。 它可能会返回正确的结果,但这纯粹是偶然的。 除训练/训练数据的那部分之外,模型本身没有实际信息。 就 GPT-4 而言,截至 2023 年 8 月,基础训练数据只截止到 2021 年 9 月。 GPT-4 在 2023 年 3 月才发布,因此,除非 OpenAI 发布使用更新后训练数据的新版本,或发布经过微调可回答这些特定问题的新版本,否则 GPT-4 的预期行为是,回复说 GPT-3 是 OpenAI 的最新模型版本。

  如果你希望帮助基于 GPT 的模型准确回答“你正在运行什么模型?”这样的一个问题,则一定要通过模型系统消息的提示工程和检索增强生成 (RAG)(这是Azure OpenAI对数据所使用的技术,采用该技术,查询时会将最新信息注入到系统消息中)等技术向模型提供该信息,或者通过微调来微调模型的特定版本,以便根据模型版本以某种方式回答该问题。

  我询问该模型其知识截止时间是何时,它给出的答案与 Azure OpenAI 模型页面上的答案不同。 为何发生这种情况?

  这是预期的行为。 这些模型无法回答有关其自身的问题。 若要了解模型训练数据的知识截止时间,请参阅模型页面。

  我向模型询问了一个关于知识截止之前刚发生的事情的问题,它得到了错误的答案。 为何发生这种情况?

  这是预期的行为。 首先,不能确保最近发生的每个事件都是模型训练数据的一部分。 即使信息是训练数据的一部分,如果不使用检索增强生成 (RAG) 之类的其他技术来帮助确定模型的响应,也总是有可能发生不可靠的响应。 Azure OpenAI 的“使用你的数据”功能和必应聊天均将 Azure OpenAI 模型与检索增强生成配合使用来帮助进一步确定模型响应。

  向最新的 GPT-4 Turbo 预览版模型询问最近发生明显的变化的事情(例如“新西兰总理是谁?”),可能会得到捏造的响应。 然而,询问模型“何时辞去总理职务?”往往会产生准确的响应,表明训练数据知识至少截止到 2023 年 1 月。

  因此,虽能通过问题来探测模型,从而猜测其训练数据知识截止时间,但模型页面是检查模型知识截止时间的最佳位置。

  我们注意到,API 调用未能完成,并出现状态代码 400,但也出现了相关的费用。 为什么失败的 API 调用会产生费用?

  如果服务执行处理,则即使状态代码为不成功(不是 200),也可能向你收取费用。 常见示例包括:由于内容筛选器或输入限制导致的 400 错误,或由于超时导致的 408 错误。 当收到了以及的时,也会产生费用。 在这种情况下,提示没有一点问题,但检测到模型生成的补全内容违反了内容筛选规则,导致补全内容被筛除。 如果服务不做处理,则不需要支付费用。 例如,由于身份验证导致的 401 错误或由于超过速率限值导致的 429 错误。