在众多人工智能大模型发布会上,自然语言处理(NLP)能力一直是各大科技厂商着重展示的要点之一,事实上,早在四年前行业内的就已经围绕这颗人工智能“皇冠上的明珠”展开过激烈的讨论……
彼时的人工智能还没有今日的火热,很多人对自然语言处理(NLP)的理解还停留在“Hi,Siri”和“小度小度”等智能对话机器人。能否实现与人流利对话也成为了人们判断人工智能能力的一大重要手段。随着ChatGPT、文心一言、360智脑等众多大模型纷纷问世,让大语言模型成为了人们关注的焦点,也让人工智能的认识更加深入和全面。
大语言模型是聊天机器人吗?
而具有大模型加持的聊天机器人在面对多样化的问题已经可以通过总结自身数据库中的数据为使用者生成答案。有业内人士对大模型之家表示,LLM当然不等价于Chatbot,不过现在的LLM很多都是用Chat数据指令调谐过的,Chat版本的LLM更适合用来构建Chatbot,技术上不能划等号。
聊天机器人是一种能够与人进行自然对话的系统,通常需要利用大语言模型来生成回复。为了让大语言模型更适合用于聊天机器人,可以在聊天数据上进行额外的训练,使其学习到更多的对话技巧和知识。因此,虽然大语言模型和聊天机器人有一定的关联,但它们在技术上是不同的概念。
无界AI联合创始人马千里对大模型之家表示,聊天机器人是语言大模型的众多功能或应用之一。语言大模型不应局限于聊天这一狭隘的场景。大模型不仅能够实现自然语言处理,还能通过各种插件功能,为使用者提供计算、文档总结、工作相关问题解答等服务。
大模型之家认为,大语言模型和聊天机器人的不同概念源自于不同的目标、评价指标、数据类型、数据规模、用户和场景。聊天机器人只是大语言模型的一个功能或应用,而不是它的本质。大模型的存在除了应用在自然语言处理方面,更重要的是体现在生产中的意义,大语言模型还有很多其他的功能或应用,比如音视频生成、金融、法律咨询等,这些都体现了大语言模型的能力和潜力。也是大语言模型商业化的重要方向。
大语言模型表现良莠不齐,根源在哪儿?
在大多数大模型发布会上,自然语言处理能力仍是被着重展示的部分,而对于使用者来说,聊天能力确实是判断大模型强大与否的重要指标之一。事实上大语言模型的表现并未像市场中吹捧的那般天花乱坠。360集团创始人周鸿祎也于近期表示,谁能解决大模型“幻觉”问题,就相当于摘下了“皇冠上的明珠”。
行业领先人工智能企业「行者AI」对大模型之家表示:虽然如今大语言模型参数规模越来越大,涌现出的能力也越来越强,但它归根结底仍然是一种概率统计模型,因此理论上来说,即使是目前最好的模型,仍然有一定概率输出不佳的结果,只是这种概率较小而已。
而具体从技术上来说,大语言模型表现好坏受众多因素影响,其一是训练数据的质量和数量,模型本质上是以训练数据为老师进行学习,数据的质量和数量直接决定模型的上限,数据质量在某些方面的参差不齐可能会导致模型回答时有好有坏;其二是模型的架构和训练策略,训练模型时选择的不同模型架构和训练策略会导致最终得到的模型性能有所差异。
当然,除技术之外,无界AI联合创始人马千里认为,大模型表现的好坏,人的“问题”也占很大一部分。他指出,大语言模型的效果同样受到提问者输入的影响。使用者需要输入一个恰当的提示语后再提出问题。而问题的形式和方式会决定模型的回答质量,因此不同的使用者可能获得不同的体验。其次,模型本身也在持续更新和优化。由于部署在云端,为了保证安全性,它增加了对敏感内容的审核机制,如果使用者询问一些涉及危险信息的问题,大模型可能不会给出回答。
在《人工智能大模型产业创新价值研究报告》中,大模型之家认为,大模型将引发数据的革命。数据的质量以及数据清洗的工程化能力会显著拉开大模型预训练阶段的效果差距将成为决胜关键因素。同时大模型的发展将为数据相关产业和行业带来多重机遇,包括数据分析和洞察力,数据清洗和预处理,数据驱动的创新,数据安全和隐私保护以及数据驱动的行业转型等。