内容摘要:

本文围绕生成式人工智能,详细介绍了ChatGPT和DALL-E是什么、机器学习和人工智能的区别、机器学习模型的主要类别、基于文本的机器学习模型是如何工作和训练的、建立生成式人工智能需要什么条件、生成式人工智能模型可以生成什么样的产品、会解决什么样的问题、人工智能有哪些局限性以及如何克服等方面内容。

ChatGPT和DALL-E是什么?

ChatGPT(generative pretrained transformer生成式预先训练转化器)现如今受到了极大的关注,它是一个免费的聊天机器人,可以对几乎所有被问到的问题给出答案。这款聊天机器人由OpenAI公司开发,并在2022年11月向公众发布测试版本,目前被认为是有史以来最好的人工智能聊天机器人。它很受欢迎,短短五天内就有超过一百万人注册使用。满怀期待的粉丝们在社交媒体上分享由聊天机器人所生成的计算机代码、大学论文、诗歌,甚至是差强人意的笑话等内容。而那些从广告文案到终身教授等以内容生产为生的职业者则充满了对智能技术的恐惧。

虽然许多人对ChatGPT(以及更广泛的人工智能和机器学习技术)感到恐惧,但机器学习显然具有向善的潜力。在广泛部署后的几年里,机器学习已经影响了许多行业,完成了诸如医学成像分析和高分辨率天气预报等工作。2022年麦肯锡的一项调查显示,在过去的五年里,人工智能的应用增加了一倍多,对人工智能的投资也在迅速增加。很明显,像ChatGPT和DALL-E(一种人工智能生成艺术的工具)这样的生成式人工智能工具有可能改变一系列工作的执行方式。不过,这种影响的边界和范围仍然是未知的,同样风险也未知。但有一些问题我们可以回答,比如生成式人工智能模型是如何建立的,它们最适合解决什么样的问题,以及它们如何融入更广泛的机器学习类别。

基于文本的机器学习模型是如何工作的?它们是如何训练的?

ChatGPT现在可能已经登上了所有的头条新闻,但它并不是第一个引起轰动的基于文本的机器学习模型。OpenAI公司的GPT-3和谷歌的BERT都是在最近几年推出的,都曾引起过一些轰动。根据大多数人的说法,ChatGPT基本运作良好(尽管它仍在评估中)。但在ChatGPT之前,人工智能聊天机器人并不总是得到最好的评价。《纽约时报》科技记者凯德·梅兹在一段视频中说,他和美食作家普里亚·克里希纳要求GPT-3为一顿感恩节晚餐写食谱,GPT-3“时而让人印象深刻,时而又让人非常失望”。

第一批处理文本的机器学习模型是由人类训练的,根据研究人员设定的标签对各种输入进行分类。例如,训练一个模型来将社交媒体帖子标记为正面或负面。这种类型的训练被称为监督式学习,由人类负责“教”模型做什么。

下一代基于文本的机器学习模型依靠的是所谓的自我监督学习。这种类型的训练包括向模型提供大量的文本,使其能够进行预测。例如,一些模型可以根据几个词来预测一个句子将如何结束。有了适当数量的样本文本——例如,广泛的互联网——这些文本模型变得相当准确。我们正在看到像ChatGPT这样的工具成功带来的准确性。

建立生成式人工智能模型需要什么?

在大多数情况下,构建生成式人工智能模型是一项重大的工程,只有少数资源丰富的科技巨头进行过尝试。OpenAI作为ChatGPT,以及先前的GPT模型以及DALL-E的开发者,获得来自著名捐助者的数十亿资金。

DeepMind是谷歌母公司Alphabet的子公司,Meta已经发布了基于生成式人工智能的Make-A-Video产品。这些公司雇用了一些世界上最好的计算机科学家和工程师。 但这不仅仅是人才的问题,当要求一个模型使用几乎整个互联网的数据进行训练时,需要为此付出的代价也是巨大的。尽管OpenAI还没有公布确切的成本,但有估算表明GPT-3是在大约45TB的文本数据上训练的,这大约相当于100万英尺的书架空间,或者整个国会图书馆四分之一的藏书量,估计成本为几百万美元。这些并不是普通创业公司可以获得的资源。

生成式人工智能模型可以产生什么样的内容输出?

ChatGPT可以在十秒钟内生成一篇被评论家称为“至少A-”的文章,内容是本尼迪克特·安德森和欧内斯特·盖尔纳的民族主义理论的比较分析。ChatGPT还产生了一段著名的段落,描述了如何以英王詹姆士一世钦定版《圣经》的风格从录像机中取出花生酱三明治。像“DALL-E”,这个名字以超现实主义艺术家萨尔瓦多·达利(Salvador Dalí)和皮克斯动画中的角色——可爱的机器人瓦力(WALL-E)的名字拼合而成,这样的人工智能生成的艺术模型可以根据需求创造出清奇的、美丽的图像,就像“拉斐尔画的圣母和孩子在吃比萨”。其他生成式人工智能模型可以生成代码、视频、音频或商业模拟。

生成式人工智能的输出是对算法训练数据进行精心校准产生的组合物。而用于训练这些算法的数据量大得惊人,如前所述GPT-3是在45TB的文本数据上训练的,因此模型在产生输出时可能显得很有“创造性”。更重要的是,这些模型通常有随机的因素,这意味着它们可以从一个输入请求中产生各种输出,使它们看起来更加栩栩如生。

生成式人工智能模型可以解决什么样的问题?

你可能已经看到,像ChatGPT这样的生成式人工智能工具可以供用户消遣和娱乐。对于企业来说,其中的机会也是显而易见的。生成式人工智能工具可以在几秒钟内生成各种可信的文章,然后对批评作出反应,使文章更符合用户目的。这对各种行业都有影响,从IT技术和软件开发组织(这些组织可以从人工智能模型即时生成的、基本正确的代码中受益),到需要营销文案的组织。简而言之,任何需要制作清晰书面材料的组织都有可能受益。这些组织也可以使用生成式人工智能来创建更多的技术材料,如更高分辨率的医疗图像。利用由此节省的时间和资源,这些组织可以追求新的商业机会和创造更多价值。

我们已经看到,开发生成式人工智能模型非常耗费资源,以至于除了规模最大和资源最丰富的公司之外,其他公司都不可能做到这一点。希望利用生成式人工智能进行工作的公司可以选择使用现成的生成式人工智能,或者对其进行微调以执行特定任务。例如,如果你需要根据特定的风格准备幻灯片,你可以要求模型根据幻灯片中的数据“学习”通常如何编写标题,然后给它提供幻灯片数据,要求它编写出适当的标题。

原文标题|What is generative AI?

文章来源|麦肯锡公司

发布时间|2023年1月19日

编译|智能society

文件链接|https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-generative-ai(5页)

Last modified: 2023年 3月 9日
Close