我们已经更新了内容

您可能已经注意到,他们时不时会说:“好的,.”它所获得的信息目前有效,直到四月份左右。这是因为当他们想要将更多信息放入模型时,他们实际上必须重新训练整个模型所以،这对他们来说成本非常高昂。 这两种限制都会影响您最终得到的答案.

我确信你已经在到过这个。 您可能正在使用ChatGPT، 但它却没有在到您询问的信息,或者它所拥有的信息已经过时.

您可能已经实现这一点的方法是通过将

一堆上下文复制并粘贴到聊天窗口中,这是我们可以充分利用的这些工具所特有的功能。或者也许您已经要求بنگ离开并去寻找某些东西。这是我们使用 whatsapp 筛查 这些工具时非常习惯的一种动态,但它特定于大型语言模型,事实上,我们可以通过将内容转储到短期记忆中并要求其与之协作来弥补长期记忆中的空白.

有趣的是,即使我们不做这些事情,这些事情在幕后也会发生。因此,当您与 Chat GPT进行对话时,该模型实际上甚至不记得它上次向您发送了什么。 每当你发送一条消息时,就会有一个脚本运行并复制整个对话,而你发送的消息实际上是机器和人之间的对话,最鸘鸢.

接下来你会说什么?所以它没有任何记忆،这对我们来说很有用,因为在所有这些类型的交互中,我们实际上依赖于尽可能地将所有上下文转储到短期记忆中的能力,但这其中可能会存在一些局限性.

上下文窗口

因此,过去的主要限制就是可以容纳 性能并了解哪种类型的弹出窗口是最 多少信息,并且许多对话都归结为上下文窗可

所以以前你无法真正在那里粘贴那么多信息。我们已经到了可以投入大量内容的地步。因此,使用 OpenAI GPT-4.5,您可以粘贴大约 300 页文本。 Anthropic 是其主要竞争对手,你可以在那里粘贴大约 500 页的文本。所以我们确实已经到了我不想在每个提示中复制并粘贴那么多信息的地步。

这实际上不再是一个限制。

ChatGPT 需要克服的问题。

但作为公司和这些工具的开发者,我们仍然需要克服一些问题。

问题是,500 页已经很多了,但还不是整个 邮寄线索 互联网。因此,他们知识上出现的空白不能仅仅通过把所有东西都塞进我们的短期记忆中来填补。

第二个问题是刘等人做了一组研究。其他一些研究人员发现,如果你在这种短期背景下工作,如果你在提示中输入大量信息,而需要提取的重要信息却埋在中间的某个地方,那么提取这些信息就会相当一致地失去其有效性。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部