麻省理工学院教授解释什么是生成式人工智能

续航客服微信二维码-black

留学申请微信咨询

微信扫描左侧二维码

点击下方按钮咨询

联系客服

本文介绍了生成式人工智能的发展和应用。生成式人工智能通过大规模数据集训练,模型学习数据之间的模式和依赖关系,从而生成类似人类写作的文本或图片。关键改进方法包括生成对抗网络(GAN)和变换器体系结构,用于提高模型质量。应用领域包括合成图像数据训练计算机视觉模型、设计新颖结构和制造领域。然而,生成式人工智能也可能带来问题,如生产力替代和偏见传播。未来可望应用于制造和智能代理系统。全文阅读时间约为8分钟。*

最近新闻铺天盖地的报道似乎让人感觉如今生成式人工智能无处不在。而实际上,你看到的其中一些新闻标题可能就是由生成式人工智能编写的,比如OpenAI的ChatGPT,这是一个聊天机器人,展示了一种神奇的能力,能够产生看起来像人类写的文本。

但当人们说“生成式人工智能”时,他们真正是指什么呢?

在过去几年的生成人工智能繁荣之前,当人们谈论人工智能时,通常是在谈论可以根据数据进行预测的机器学习模型。例如,这些模型通过数百万个示例进行训练,以预测某个X光是否显示肿瘤迹象,或者特定借款人是否可能违约。

生成式人工智能可以被视为一种机器学习模型,它被训练用于创建新数据,而不是对特定数据集进行预测。生成式人工智能系统是那些学会生成看起来像它们训练数据的对象的系统

“当涉及到生成式人工智能和其他类型的人工智能的实际机制时,区别可能有点模糊。通常,相同的算法可以同时用于两者,”麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员菲利普·伊索拉说道。

尽管ChatGPT及其同类发布时带来了一些炒作,但这项技术本身并非全新。这些强大的机器学习模型借鉴了50多年来的研究和计算进展。

复杂性的增加

生成式人工智能的早期例子是一个更简单的模型,被称为马尔可夫链。该技术以安德烈·马尔可夫(Andrey Markov)的名字命名,他是一位在1906年引入这种统计方法来模拟随机过程的俄罗斯数学家。在机器学习中,马尔可夫模型长期以来一直用于下一个单词预测任务,比如电子邮件程序中的自动补全功能。

在文本预测中,马尔可夫模型通过查看前一个单词或前几个前一个单词来生成句子中的下一个单词。但由于这些简单的模型只能回顾到那么远,它们不擅长生成合理的文本,麻省理工学院电气工程与计算机科学教授、CSAIL和数据、系统和社会研究所(IDSS)成员汤米·贾科拉表示。

“在过去的十年中,我们一直在生成东西,但这里的主要区别在于我们可以生成的对象的复杂性以及我们可以训练这些模型的规模,”他解释道。

就在几年前,研究人员倾向于专注于找到一种机器学习算法,以最好地利用特定数据集。但这种关注已经有所转变,许多研究人员现在使用更大的数据集,可能包含数亿甚至数十亿个数据点,以训练能够取得令人印象深刻结果的模型。

ChatGPT及其类似系统的模型工作方式与马尔可夫模型基本相同。但一个重要的区别在于,ChatGPT具有数十亿个参数所以要更大的多且更复杂。它已经在大量的数据上——互联网上大部分可用的文本进行了训练。在这个庞大的文本语料库中,单词和句子以特定的依赖关系序列出现。这种重复出现有助于模型理解如何将文本划分为具有一定可预测性的统计块。它学习这些文本块的模式,并利用这一知识提出可能出现的下一个内容。

更强大的体系结构

虽然更大的数据集是导致生成人工智能繁荣的一个催化剂,但各种主要的研究进展也导致了更复杂的深度学习体系结构。

2014年,蒙特利尔大学的研究人员提出了一种称为生成对抗网络(GAN)的机器学习体系结构。GAN使用两个协同工作的模型:一个学会生成目标输出(如图像),另一个学会区分真实数据和生成器输出。生成器试图欺骗辨别器,在这个过程中学会生成更真实的输出。图像生成器StyleGAN就是基于这些类型的模型的。

扩散模型是一年后由斯坦福大学加利福尼亚大学伯克利分校的研究人员引入的。通过反复改进其输出,这些模型学会生成新的数据样本,类似于训练数据集中的样本,并用于创建逼真的图像。扩散模型是文本到图像生成系统稳定扩散的核心。

2017年,谷歌的研究人员引入了变换器体系结构,已用于开发大型语言模型,如驱动ChatGPT的模型。在自然语言处理中,变换器将文本语料库中的每个单词编码为一个令牌,然后生成一个关注图,捕捉每个令牌与所有其他令牌的关系。这个关注图有助于变换器在生成新文本时理解上下文。

这些只是可以用于生成人工智能的许多方法中的一些。

更广泛的应用

所有这些方法的共同之处在于它们将输入转换为一组令牌,这些令牌是数据块的数值表示。只要您的数据可以转换为这种标准的令牌格式,理论上,您可以应用这些方法来生成看起来相似的新数据。

“您的效果可能会有所不同,这取决于您的数据有多嘈杂以及信号的提取有多困难,但它确实更接近于通用CPU可以接收任何类型的数据并以统一的方式开始处理它的方式,”伊索拉说。

这为生成人工智能开辟了广泛的应用领域。

例如,伊索拉的团队正在使用生成人工智能创建合成图像数据,这些数据可以用于训练另一个智能系统,例如通过教授计算机视觉模型如何识别对象。

贾科拉的团队正在使用生成人工智能设计新颖的蛋白质结构或指定新材料的有效晶体结构。就像生成模型学习语言的依赖关系一样,如果它显示晶体结构,它就可以学习使结构稳定和可实现的关系,他解释道。

但是,尽管生成式模型可以取得令人难以置信的结果,它们并不适用于所有类型的数据。对于涉及对结构化数据进行预测的任务,例如电子表格中的表格数据,生成人工智能模型往往不如传统的机器学习方法效果好,麻省理工学院电气工程与计算机科学教授、IDSS和信息与决策系统实验室成员德瓦夫拉特·沙说。

在他看来,“它们的最高价值在于成为这种与人类友好的机器的出色接口。以前,人们不得不用机器的语言与机器交流来完成工作进行下一步。而现在,这个界面已经找到了如何同时与人类和机器交流的方式,”沙说。

需要引起警觉

生成式人工智能聊天机器人现在被用于呼叫中心,以回答人类客户的问题,但这种应用突显了实施这些模型的一个潜在问题——工人将被替代。

此外,生成人工智能可能会继承和传播在训练数据中存在的偏见,或者加剧仇恨言论和虚假陈述。这些模型有能力剽窃,并且可以生成看起来像是由特定人类创作者制作的内容,从而引发潜在的版权问题。

另一方面,沙提出,生成式人工智能可能赋予艺术家权力,他们可以使用生成工具帮助他们制作他们本来没有能力制作的创意内容。

在未来,他认为生成式人工智能将改变许多学科的经济状况。

伊索拉看到生成式人工智能一个有希望的未来方向是用于制造。与其让模型制作一张椅子的图像,也许它可以生成一张可以制作椅子的计划。

他还看到生成人工智能系统在开发更智能的人工智能代理方面有未来的用途。

“这些模型的工作方式以及我们认为人类大脑的工作方式之间存在差异,但我认为也存在相似之处。我们有能力在脑中思考和梦想,提出有趣的想法或计划,而我认为生成人工智能是赋予代理人做到这一点的工具之一,”伊索拉说。

新闻资料来源:Explained: Generative AI

读者可能会感兴趣的问题:
1. 生成式人工智能究竟是如何训练的?它们是如何生成看起来像人类写的文本或图片的?
2. 生成对抗网络(GAN)和变换器体系结构是如何改进生成式人工智能模型的?
3. 生成式人工智能的应用范围有哪些?除了创建新数据,还有哪些更具创新性的应用?
4. 生成式人工智能可能会带来哪些潜在问题,例如:生产力替代、偏见传播或版权问题等?
5. 生成式人工智能在未来可能会如何影响不同领域的经济状况和人工智能代理的发展?

回答:
1. 生成式人工智能通常是通过大规模的数据集进行训练,类似于监督学习,模型会学会数据之间的模式和依赖关系。其中最新的模型如ChatGPT使用数十亿参数,在大量互联网文本数据上训练,以便生成看起来像人类写的文本。这些模型会根据前面的文本内容预测接下来可能的文本。
2. 生成对抗网络(GAN)和变换器体系结构是两种重要的改进方法。GAN使用两个模型相互对抗,一个生成器负责生成数据,另一个判别器则尝试区分真实数据和生成器输出,模型通过对抗学习逐渐提高生成器的性能。而变换器体系结构则帮助模型理解文本的上下文关系,并生成更加通顺的文本内容。
3. 生成式人工智能的应用范围非常广泛,如创建合成图像数据用于训练计算机视觉模型,设计新颖的蛋白质结构或新材料的结构等。此外,这些模型也可用于制造领域,如生成可以制作椅子的计划,还可用于开发更智能的人工智能代理。
4. 生成式人工智能可能会带来一些潜在问题,比如生产力替代,可能会导致工人被替代;模型可能传播训练数据中存在的偏见,也可能产生仇恨言论和虚假陈述;此外,模型也可能导致版权问题,因为可以生成看起来像特定人类创作者内容。
5. 生成式人工智能在未来可能会带来深远的影响,可能会改变许多学科的经济状况。一些潜在的未来应用包括在制造领域生成制造计划,以及帮助智能代理系统更智能地操作。生成式人工智能可能会成为未来创作和设计的强大工具。

*简介与问答内容由人工智能chatGPT根据文章内容总结发散,仅供参考,如有冲突请以正文内容为准

【独家稿件声明】本文为美国续航教育(Forward Pathway LLC,官网地址:www.forwardpathway.com)原创,未经授权,任何媒体和个人不得全部或者部分转载。如需转载,请与美国续航教育联系;经许可后转载务必请注明出处,违者本网将依法追究。

美国续航教育总部位于美国加利福尼亚州洛杉矶,同时在中国上海和深圳设有续航教育分部。续航教育自2013年成立以来,致力于研究中美之间的文化教育发展与趋势,提供最专业的美国留学一站式服务,获得美国国际招生协会AIRC及国际教育顾问委员会ICEF的双重认证。

美国招生协会
AIRC权威认证

2000+ TOP50
成功申请案例

7000+ 学校
独家数据库信息支持

点击了解详情

留学宝典

史上最全留学指南

续航客服微信二维码-black

咨询留美申请详情

微信扫描左侧二维码

点击下方按钮咨询

联系客服

觉得有用的话就评价/分享一下吧~

留学宝典

美国留学宝典

史上最全留学指南

联系我们

24小时在线客服咨询

 续航教育企业微信客服二维码

⬆⬆⬆微信扫码咨询

或点击下方按钮


联系电话:
+1 412-230-8666

邮箱:
[email protected]

Generic filters
Exact matches only