目录
前言
1. 什么是生成式人工智能?
2. 生成式人工智能的历史
3. 揭开GenAI的面纱——什么是LLM?
4. 了解生成式人工智能模型及其类型
5. 生成式人工智能的主要应用是什么?
生成式AI行业应用
生成式AI功能应用
6. 了解生成式人工智能的局限性
7. 生成式人工智能的未来
世界经历了多个创新周期。统治一切的唯一宇宙法则。纵观人类学历史,一直存在着这些创新周期,它们改变了世界的进程,将其带向全新的方向。
例如农业的发现。这将整个人性从狩猎采集者转变为创造者、种植者和定居者。许多伟大的文明都诞生在世界大河之畔。考虑任何其他例子——有机硅重新构想了医学和天体物理学领域,蒸汽机迎来了大规模生产商品和商业的黄金时代。
目前,整个世界正在经历这样一个创新周期,人工智能驱动的数字化占据主导地位。本指南帮助读者深入了解生成式人工智能、其尚未开发的潜力,以及如何利用其能力在商业世界中赢得巨大胜利。
生成式人工智能是一种先进技术,能够生成文本、语音、视觉甚至合成数据形式的内容。它利用深度学习模型和大型语言模型来完成创建新颖内容的任务。
“Its (Generative AI’s) performance will compete with the top 25 percent of people, completing any and all tasks before 2040 – McKinsey”
生成式人工智能的性能将与前 25% 的人竞争,在 2040 年之前完成所有任务——麦肯锡
生成式人工智能已经引起了世界的轰动,人工智能自己的迈克尔·乔丹连续扣篮得分。它绝对不仅仅是进行上下文对话,还包括定制建议、直观的解决方案等等。其应用广泛分布在从高科技到农业和消费品的各个行业。
当世界各地领先的研究公司预测生成式人工智能在增强人类能力方面有很多未开发的潜力时,这应该是理所当然的。
-
Gartner 将生成式 AI 置于 2023 年新兴技术成熟度曲线期望最高的位置。
-
德勤(Deloitte) 估计,到 2032 年,生成式人工智能的市场规模将达到 200B 美元。这占人工智能总支出的约 20%,高于目前的约 5%。
生成式 AI 一词可能是最近的趋势,但其背后的历史至少可以追溯到 70 年前,当时人类真正开始怀疑机器是否有能力像人类一样思考和处理。让我们暂时回顾一下人工智能领域的形成时期。
从 20 世纪 50 年代文本分析的起步,到 GPT(生成式预训练Transformer)等强大语言模型的出现,每个阶段都标志着我们在创造能够理解和生成人类语言的机器的探索中取得了重大飞跃。
1950 年代:文本分析 — 人工智能的黎明
20世纪50年代至60年代初,人工智能(AI)领域仍处于起步阶段。研究人员正在探索创造能够模拟人类智能的机器的可能性。这个方向最早的努力之一是文本分析。这个时代见证了用于处理和分析文本数据的基本计算机程序的发展。
早期的文本分析系统主要专注于信息检索和关键字提取等简单任务。这个想法是让计算机能够以类似于人类理解的方式理解和操作文本。虽然这些努力在当时具有开创性,但它们的能力有限,并且缺乏我们今天与人工智能相关的复杂程度。
1960 年代:基于规则的系统和知识库
在 20 世纪 60 年代后半叶和整个 70 年代,人工智能研究转向基于规则的系统和知识库。研究人员试图使用明确的规则和逻辑推理将人类知识和专业知识编码到计算机程序中。这种方法导致了专家系统的发展,该系统能够通过遵循预定义的规则来解决特定问题。
专家系统标志着人工智能向前迈出了重要一步,因为它们证明计算机可以执行需要人类专业知识的任务。然而,它们受到大量手动规则编写的需要和对新领域的有限适应性的限制。
1980 年代:自然语言处理出现
20 世纪 80 年代和 90 年代见证了自然语言处理 (NLP) 的出现,这是人工智能中的一个关键领域,旨在使机器能够理解和生成人类语言。研究人员开始开发更先进的技术来解析和分析文本,为机器翻译、语音识别和情感分析等应用铺平道路。
NLP 系统在很大程度上仍然是基于规则的,依赖于语法和句法规则。这些系统能够处理比早期文本分析更复杂的语言任务,但它们距离实现人类水平的语言理解还很远。
2000 年代:机器学习和大数据革命
世纪之交标志着随着机器学习的兴起和大量数字数据的出现,人工智能研究发生了重大转变。事实证明,机器学习算法,特别是神经网络,在解决各种人工智能任务(包括与文本和语言相关的任务)方面非常有效。
这个时代催生了“大数据”的概念和大规模数据分析的发展。随着深度学习等技术的出现和海量数据集的出现,人工智能模型越来越能够理解和生成人类语言。
2020 年代:GPT-3 和生成式 AI 的突破
2020年代,世界见证了GPT-3(生成式预训练Transformer3),这是一种革命性的人工智能模型,标志着人工智能和自然语言处理领域的一个重要里程碑。GPT-3 在大量文本数据上进行了预训练,可以生成高度连贯且上下文相关的文本。
GPT 的发展仍在继续,推出了运行 ChatGPT 的 GPT 3.5 和最新版本的 GPT 4。
如果不了解大型语言模型,那么关于生成式人工智能的讨论就是不完整的,人们简称为LLM。大型语言模型是在具有大量参数的大型未标记数据集上进行训练的。GPT-3 经过超过 1750 亿个参数的训练!
根据需要,未标记的数据集可以是开源的(如维基百科页面),也可以是私有的(如内部培训文档)。LLM的全部功能以单词或单词序列的概率分布为中心,这些单词或单词序列组合在一起形成句子或短语。
LLM预测句子中下一个可能的单词。
下一个可能单词的预测基于特定的“有效性”,并且该有效性不一定由语法规则来识别。相反,它是由人类如何组织语言句子的因素决定的。学习或在一定程度上模仿人类如何组织语言,是对大量数据集进行语言训练的结果。
让我们通过一个例子来证明这一点。
如果人工智能生成了上述句子,它就会为每个单词及其替代词关联一个概率分数。分数是根据人类用这些特定单词集按精确顺序创建句子的概率来计算的。
从概率分数列表中,LLM可以了解到,与其他三个单词相比,“武器”一词已被人类频繁使用。在这个假设的例子中,我们仅展示四种可能的替代方案。但实际上,单词列表会更长,并且变量更多。
人们必须明白,人工智能正处于一个持续学习的阶段。它将深入并对类似字母的出现进行评分。就比如,在“w”之后,“e”是重复次数最多的字母。所有这些都是通过先进的机器学习算法实现的。
一些众所周知的LLM包括:
-
Open AI’s GPT 3, 3.5, and 4
-
Google’s LaMDA and PaLM
-
Hugging Face’s BLOOM
-
meta’s LLaMA
-
NVidia’s NeMO LLM
在这个列表中,meta 的 LLaMA 是一个开源 LLM,世界各地的开发人员都可以利用它来创建可定制的私有模型。
LLM(语言模型)和生成式人工智能是相关的概念,但它们在侧重点、能力和应用方面存在明显差异。
既然我们已经讨论了 GAN,那么肯定有人想更多地了解其他类型的生成式 AI 模型。让我们更深入地了解当今使用的关键生成式人工智能模型。
生成式AI模型是人工智能 (AI) 模型的一个子集,旨在生成与现有数据类似或遵循现有数据中的模式的新数据。生成式 AI 模型不同于其他专注于分类、预测或强化学习的 AI 模型。
以下是生成式人工智能模型的一些关键特征和类型。
-
数据生成:生成式人工智能模型能够创建模仿训练数据中观察到的模式或风格的新内容。该内容可以采用多种形式,包括文本、图像、音乐等。
-
无监督学习:许多生成模型采用无监督学习技术,模型在没有明确标签或目标的情况下学习数据中的模式和结构。这使他们能够生成数据,而不需要应生成的具体示例。
-
可变性:生成模型通常以其产生不同输出的能力为特征。例如,他们可以生成不同风格的艺术,以不同方式重新表述相同的文本段落,或者图像的多个版本。
现在,让我们探讨一些常见类型的生成人工智能模型。
-
生成对抗网络(GAN):GAN 由两个处于竞争关系的神经网络(生成器和判别器)组成。生成器创建数据,而鉴别器评估该数据的真实性。这种对抗性过程导致生成器提高了创建真实数据的能力。GAN 已广泛用于图像生成、风格迁移和内容创建。
-
变分自动编码器 (VAE):VAE 是基于概率建模原理的生成模型。他们的目标是了解数据的潜在概率分布。VAE 通常用于图像生成、数据压缩和图像重建。
-
循环神经网络 (RNN):RNN 是一种专门为序列数据(例如文本和时间序列数据)设计的神经网络架构。它们用于文本生成、机器翻译和语音识别。然而,传统的 RNN 在捕获长期依赖性方面存在局限性。
-
长短期记忆 (LSTM) 网络:LSTM 是一种特殊类型的 RNN,可以捕获顺序数据中的长程依赖性。事实证明,它们在自然语言处理任务中非常有效,包括语言建模、文本生成和情感分析。
-
生成式预训练 Transformer (GPT):GPT 模型是生成人工智能领域的最新突破。这些模型利用 Transformer 架构和对文本数据的大规模预训练来生成连贯且上下文相关的文本。他们擅长各种自然语言理解和生成任务,包括聊天机器人、内容生成、翻译等。
生成式人工智能的影响力是无限的,它彻底改变了各个行业、职能和角色。从增强内容创建到增强个性化教育、医疗保健、客户服务和营销,生成式人工智能的应用是无限的。
我们将其分为两个不同的集群,您可以在其中按行业和功能探索生成式人工智能的应用。
营销、广告和娱乐业
-
内容创作:生成式人工智能以艺术、音乐、文学等形式推动内容创作。艺术家和音乐家利用人工智能创作新作品并探索创新的创作方向。
-
视频游戏开发:人工智能驱动的生成系统创建游戏环境、角色甚至对话,减少游戏开发所需的时间和资源。
-
剧本创作:编剧和内容创作者利用生成式人工智能,通过生成对话、情节和角色互动来协助剧本创作。
教育领域
-
个性化学习:生成式人工智能通过生成量身定制的作业、测验和学习材料,使教育内容适应个别学生的需求,促进个性化的学习体验。
-
知识库:生成式人工智能可用于创建详尽的知识库,学生可以使用该知识库以对话方式获取瞬时信息。
-
虚拟实验室:生成式人工智能为虚拟实验室提供支持,为学习科学、工程和其他实践学科的学生模拟实验和场景。
医疗保健行业
-
医学图像生成:生成式人工智能用于生成合成医学图像,用于训练机器学习模型、提高诊断准确性以及出于教育目的模拟罕见的医疗状况。
-
药物发现:制药公司利用生成式人工智能通过生成分子结构来发现新的药物化合物,从而加速药物开发过程。
-
个性化医疗:人工智能驱动的生成模型分析患者数据,生成个性化治疗计划,同时考虑遗传因素、病史和当前健康状况。
制造业
-
产品设计:生成式设计利用人工智能算法生成优化的产品设计,考虑材料、重量和结构完整性等因素,简化产品开发流程。
-
质量控制:生成式人工智能模型生成用于质量控制测试的合成数据,确保制造过程符合质量标准。
-
供应链优化:人工智能生成的需求预测和供应链场景可帮助制造商做出有关生产和分销的明智决策。
软件与科技行业
-
代码生成:生成式人工智能可以通过为常见编程任务生成代码片段和模板来帮助开发人员,从而加快开发流程。
-
错误检测:人工智能驱动的工具可以生成综合测试用例和场景,以帮助更有效地识别和修复软件错误。
-
IT 安全:生成式 AI 模型可以模拟网络攻击场景,帮助 IT 部门识别漏洞并增强网络安全措施。
客户服务
-
聊天机器人和虚拟助理:生成式 AI 为智能聊天机器人和虚拟助理提供支持,可以 24/7 处理客户查询、提供信息和解决问题。
-
情绪分析:人工智能生成的情绪分析报告可帮助客户服务团队了解客户的情绪和反馈,从而实现更加同理心和有效的响应。
-
自动工单路由:生成式人工智能算法有助于将客户查询路由到正确的部门或代理,优化响应时间和问题解决。
营销
-
内容生成:生成式人工智能可帮助营销人员生成高质量且引人入胜的内容,包括博客文章、社交媒体更新和广告文案。
-
个性化:人工智能算法使用客户数据生成个性化营销活动,为个人客户定制内容和建议。
-
A/B 测试:生成式 AI 可以提出 A/B 测试想法,通过预测哪些变化会产生最佳结果来帮助营销人员完善策略。
人力资源
-
自动简历筛选:生成式人工智能根据不同的参数(如资格、教育、技能等)对简历进行分类,从而加速筛选过程。
-
个性化学习路径:人工智能通过生成定制培训建议、自动评估等来定制员工发展计划。
-
虚拟人力资源助理:由生成式人工智能支持的聊天机器人可以与员工共享政策信息、无缝地培训新员工、回答组织问题等。
销售
-
潜在客户生成和评分:生成式人工智能分析客户资料,以识别潜在的潜在客户,并通过将其分组为优先级来为销售团队生成目标列表。
-
销售内容:人工智能协助创建销售材料,例如宣传材料、销售电子邮件和产品演示,以增强销售流程。
-
价格优化:生成式人工智能模型可以根据市场动态和客户数据推荐定价策略并生成报价。
运营及采购
-
维护计划:生成式人工智能有助于预测设备维护需求、优化维护计划并减少停机时间。
-
供应商选择:生成式人工智能分析供应商数据和市场趋势,推荐合适的供应商,帮助采购部门做出明智的决策。
-
供应商谈判:生成式人工智能提供谈判策略,协助采购专业人员获得有利的条款和价格。
“(Generative) AI is like a glorified tape-recorder. It takes snippets of what’s on the web created by a human, splices them together and passes it off as if it created these things. And people are saying, ‘Oh my God, it’s a human, it’s humanlike.’” – Michio Kaku, Renowned Theoretical Physicist and Futurist
“(生成式)人工智能就像一台精美的录音机。它获取人类在网络上创建的内容的片段,将它们拼接在一起,然后将其传递出去,就好像它创建了这些东西一样。人们说,‘天哪,这是一个人类,它像人类一样。’”——著名理论物理学家和未来学家加来道雄 (Michio Kaku)
每个人最关心的问题之一是“ChatGPT 会接管我的工作吗?”。可以肯定的是,这些担心是没有根据的,因为生成式人工智能还没有感知能力。
有感知的设备仍然是未来的梦想。在喧嚣声中,区分这项突破性技术的炒作和现实至关重要。让我们从现实世界的角度了解生成式人工智能的局限性。
了解背景
生成式人工智能难以掌握上下文,导致在自然语言处理任务中偶尔出现无意义或不相关的响应。
真正的创造力
虽然生成式人工智能可以模仿创意风格,但它缺乏真正的创造力、想象力和情感深度。它依赖于模式和数据,而不是真正的灵感。
幻觉
生成式人工智能很容易出现一种称为幻觉的情况。人工智能幻觉会根据自己对场景或上下文的理解生成虚假内容。
偏见与公平
生成式人工智能模型可能会无意中使训练数据中存在的偏见永久化,从而导致产生反映社会偏见的有偏见的输出。
生成式人工智能的故事远未结束,它不断学习和成熟。生成式人工智能的未来前景广阔,它将重塑我们与技术交互和解决复杂问题的方式。在发挥其潜力和应对挑战之间取得平衡至关重要。我们相信未来生成式人工智能将影响以下三个领域。
-
快速频繁地创建内容:虽然生成式人工智能在实现真正的创造力方面存在局限性,但它可以快速、大规模地创建跨广泛主题的多种形式的内容。同时地,这可以跨行业、职能和角色来利用,以推动组织目标。
-
自然直观的对话:虚拟助理和聊天机器人将变得更有能力处理复杂的查询、提供个性化建议以及进行情感智能对话。他们将在客户服务、医疗保健和教育方面发挥重要作用。
-
大规模个性化:生成式人工智能将实现从营销到医疗保健等各个行业的超个性化。人工智能系统将分析大量数据以提供量身定制的体验和建议。个性化的活动、内容和产品推荐将成为提高用户满意度和参与度的规范。