ChatGPT热乎劲还没过,GPT-4又来了

作者:Yu 来源:原创 2023-03-15

  ChatGPT的高级功能,如调试代码、写文章或讲笑话,使其在发布之后迅速爆红。尽管ChatGPT的功能强大,但仅限于基于文本的答案。

  不过,这种情况正在发生着改变。

  什么是GPT-4?

  近日,ChatGPT开发商OpenAI发布了全新的多模态预训练大模型GPT-4,可以处理各种类型的输入,包括视频、音频、图像和文本,并可能生成视频和音频内容。

  GPT-4还不能从文本中生成图片和视频,但它能够接受可视化输入,例如图表或工作表的图像,这比之前的模型有了重大改进。处理图像输入的能力仍在开发中,该公司表示,正在与一个合作伙伴合作,进一步开发这一能力。OpenAI尚未提供该功能何时向公众开放的时间表。

  另外,GPT-4的多模态能力可以增强AI聊天机器人。GPT-4可以同时执行多项任务,并且产生事实响应的可能性提升40%,这使得它对于依赖事实性信息的应用程序,如搜索引擎来说是一个更有用的工具。

  据悉,在所有指标中,GPT-4比之前的模型都有了显著的改进,抛开可以处理图像这一功能不谈,它还能够比GPT-3或GPT-3.5更细致、更可靠、更具挑战性地输出,具体来看:

  第一,处理图像和文本

  如上所述,这是GPT-4与其前几代模型之间最大的区别。GPT-4是多模式的,这意味着它可以分析图像的内容,并将这些信息与书面问题联系起来。

  有媒体重点报道了一个演示,如果给出冰箱内部的照片,并被问及你可以用这些食材做什么饭菜。基于这张图片,GPT-4可以根据冰箱中的物品,给出用餐建议。

  第二,处理更多的文本

  AI语言模型一直受到短期记忆中文本数量的限制,即用户问题和系统答案中包含的文本。但是OpenAI已经极大地扩展了GPT-4的这些功能。GPT-4现在可以一次性处理整个科学论文和中篇小说,允许它回答更复杂的问题。

  值得注意的是,GPT-4本身没有字符或字数计数,而是用一个称为“令牌”的单位来测量输入和输出。这个标记化过程相当复杂,一个令牌大约等于四个字符,75个单词通常占用大约100个令牌。

  GPT-4可以处理多达25000个单词,大约是ChatGPT的八倍。该公司表示,仍在为更长的上下文进行优化,但更高的限制意味着该模型应该可以解锁以前不那么容易实现的用例。

  第三,通过考试

  OpenAI关于GPT-4的技术报告中最突出的指标之一是它在一系列标准化测试中的表现,如在美国统一律师资格考试(Uniform Bar Exam)中,GPT-4的分数位于前10%左右,而GPT-3.5的分数则位于后10%左右;在美国法学院入学考试(LSAT)中,GPT-4的得分高于88%的考生,而GPT-3.5仅能超过40%的考生。

  OpenAI还声称,在一系列机器学习基准测试中,GPT-4的表现优于谷歌的PaLM和Meta的LLaMA等竞争对手的大型语言模型。

  GPT-4将带来哪些变化?

  事实上,将GPT-4集成到日常工作或学习流程中的人们可以期望看到巨大的变化,而这些变化主要体现在三个方面:

  一是提高了生产率:当使用GPT-4时,可以有效地自动化任务或让人工智能做繁重的工作,如果这是一项重复的任务,会增加大量的时间。人们可以利用GPT-4执行写电子邮件、社交媒体标题和生成评论回复的任务。

  二是成为创意助手:GPT-4可以成为头脑风暴助手,给它提供一个主题,就可以为文章生成一个内容创意列表。另外,GPT-4还可以根据图片或想要传达的信息的简短描述,创建一个引人注目的标题。

  三是改善用户体验:在网上搜索答案时,通常会翻3-4页,直到找到正确的答案。借助GPT-4,就可以直接得到答案,同时也不会被充斥整个页面的广告轰炸。这是为普通用户准备的。如果是针对企业,聊天机器人的响应时间和内容的参与率将有助于改善客户体验,从而提高留存率。

  此外,GPT-4可以在许多其他任务中派上用场,例如文本补全、文本分类和语言翻译。随着模型变得越来越先进,我们可能会看到领先企业可以广泛采用的更先进的应用程序。

  写在最后:

  毫无疑问,GPT-4是一项令人兴奋的技术,它增强了对语言的理解,提高了创造力和灵活性,可以在语言翻译、内容创作和客户服务方面取得重大进步。然而,与任何新技术一样,也必须解决重大的道德问题,包括偏见和歧视、隐私和安全以及技术的潜在滥用。

  随着GPT-4和其他先进人工智能技术的发展,人们应该采取积极主动的方式来解决以上这些问题。唯有如此,才能够确保这项技术的效益最大化,同时将潜在风险和负面影响降至最低。

发布
X
第三方账号登录
  • 微博认证登录
  • QQ账号登录
  • 微信账号登录

企业俱乐部