ChatGPT指南从原理到应用让每个人都能轻松掌握

作者:京东科技 何雨航

 

ChatGPT的潜力如何充分挖掘,成为众多企业热议的话题。但是,AI技术的发展不一定意味着对所有员工都有益。像IBM计划使用AI替代7800个工作岗位,一些游戏公司也使用MidJourney技术削减原画师数量。这方面的新闻时常见到。因此,对于求职者和职场人员来说,了解并掌握这种新技术的重要性越来越高。

GPT是一种基于Transformer架构的大型语言模型(LLM)。 ChatGPT是基于GPT模型的AI聊天工具,简称GPT。了解原理是应用有效性的第一步。

区别于传统的目标培训的AI,大型模型可以处理更多的问题。例如,经典的AlphaGO模型只是针对下棋进行训练。

NLP旨在解决用户更广泛的问题,并包含两个关键步骤:自然语言理解(NLU)和自然语言生成(NLG)。

大型语言模型(如GPT)采用了一种完全不同的方法来实现NLG阶段的统一性。以”大力出奇迹”的信念,将大量的知识注入到一个单一的模型中,而不是针对每个特定的任务单独训练模型,从而极大地增强了AI处理多种类型问题的能力。

第一层:聊天能力

在这种使用情况下,GPT的回答是对客户的交付物,是GPT模型最简单、最直观的用途。

2.定制聊天机器人

通过制作定制化的聊天机器人,可以将GPT用于更广泛和复杂的领域,例如,在客服或帮助台方面提供支持。

针对ChatGPT,很多开发者会基于OpenAI官方接口,开发一个套壳聊天机器人产品。这类产品存在的原因毋庸置疑。但为什么用户不直接使用ChatGPT呢?这类产品难以形成现象级应用,而且竞争也非常激烈。由于灰色性质,这类网站的内容未经过滤,因此被封,又换域名的事情屡见不鲜。

2.场景化问答

这种模式对GPT的回复场景进行了限制。通过限定提示词、嵌入大量特定领域的知识以及微调技术,使GPT能够仅基于特定身份回答特定类型的问题。对于其他类型的问题,机器人会告知用户不了解该问题。这种用法可以有效限制用户的输入,降低许多不必要的风险,但是想训练一个出色的场景化机器人,需要投入很多精力。典型的应用包括智能客服、智能心理咨询和法律咨询等。微软的新版本Bing就是此类应用的杰出代表,其俏皮的回复风格深受用户喜爱。

第二层:语言能力

在这一层,我们可以充分利用ChatGPT的语言优势,辅助各种基于文字的处理工作。从这一层开始,我们可以实现更加复杂的任务,例如文本编辑、摘要提取、翻译、舆情分析等,这使得机器人能够处理更加多样化的问题。

为了提升ChatGPT的表现,需要使用one-shot或few-shot技术(在提示词中给ChatGPT一个或多个示例)。与用户的交互不再局限于聊天窗口,而是预先设置提示词模板,用户只能输入限定的信息,对应提示词的空槽位。

预制带槽位提示词模板的应用基本流程如下:

2.AI辅助决策

基于第一个阶段的基础,将对应页面的部分功能与GPT联动。这样,在员工执行操作时,部分功能可以由AI实现,提高效率。微软Copilot正是这类产品的代表。例如,在Excel中,Copilot可以帮助用户说明要进行的数据分析,而无需手动编写复杂代码,从而大大降低了运行成本。

数据分析需要复杂的公式和模型,但未来的愿景是实现全自动AI工作流,让GPT自动完成数据分析。然而,GPT很难解决特定领域的复杂细节问题,因此需要AutoGPT、AgentGPT等针对特定场景的微调。

在国内,大量中文语料和中文微调可以让我们拥有符合本国文化背景和价值观的大模型,突破千亿甚至八千亿就可以与GPT-4匹敌。但是,训练大模型的成本极高,训练数据的质量也要求极高,模型优化也很复杂,而且马太效应也很明显。因此,在未来五年内,预计只会有不超过3家知名大模型服务商在中国。而大模型也将成为AI时代的基础设施,大部分公司将直接应用它,获得商业价值。

那些勇于投身于自有大模型建设的国内企业格外值得敬佩。ChatGPT是一款跨时代的产品,不同层面对GPT技术的应用,揭示出了一些共性的机会,其中三项未来具有巨大的价值。

第一项是问题分解技术。由于GPT的回复限制在于最多只能基于32,000个tokens,因此将问题分解为子问题再交由GPT处理变得尤为关键。未来的工作方法可能将问题拆分为子问题,并组装子问题的解决方案。在具体实践中,还需要对子问题的难度进行判断,有些问题可以交给一些小模型处理,如此一来,还可以有效控制应用成本。

第二项是三种调优方法。想让GPT在多个层面上发挥特定的作用,可以采用三种不同的交互方式,成本从低到高依次为:

调优方法

优势

缺点

提示词优化

提高ChatGPT的表现,用户体验更好

用户模拟(One/few-shot)

提高对于特定领域知识的理解

微调模型

提高ChatGPT的专业性,更好地解决特定问题。

第三项是通关能力。可“通关”的意思是基于GPT实现更多的应用方案,比如文章摘要或翻译,或者是生成交互式学习模块等等。这可以帮助企业更广泛地应用GPT技术,获得更大的商业价值。

GPT技术有着广阔的应用前景,但不同的应用场景需要采用不同的调优方法。其中,提示词优化是最为重要、极具成本效益的方法。通过寻找最优提示词模板,可以为用户提供广泛的功能,其底层的实现主要基于特定提示词的套路。好的提示词包含了角色、背景、问题任务以及输出标准等四个要素。业界研究表明,好的提示词能够将GPT3.5的可用性从30%带到80%以上。

嵌入调优方法也是GPT技术中的一种重要手段,相较于通过更多训练获得高精度的模型,嵌入调优方法能够在不增加运算成本的前提下实现模型性能的提升。

而微调技术则需要搭建真正的私有模型,以实现GPT对相关问题的理解。虽然微调技术的成本较高,需要大量的问答对进行模型的训练,但在能够扩展GPT知识库的同时降低了成本。

因此,对于不同的应用场景,选用符合需求的调优方法十分重要,让GPT技术在不同领域发挥出最佳的性能和商业价值。

为了让GPT技术能够在不同场景下发挥最佳性能和价值,需要选用符合需求的调优方法。其中,有一种搭建自有知识库的方法,通过使用embedding技术向量化自建知识库,GPT就能够基于自有数据来进行问答。

另外,微调(finetune)这种获取高精度模型的方法,需要输入大量问答,真正教会GPT如何回答某类问题。虽然成本通常比前两种方法高,但这种方法的优势在于可以将提示词的短期记忆转化为私有模型的长期记忆,从而完善提示词的其他细节并释放token。

这三种方法并不冲突,通常会在工程实践中互相配合,特别是前两种。

此外,私有数据的积累价值也得到了进一步提升,各行业可基于此对GPT进行二次包装,更好地解决特定领域问题。建议使用微软Azure提供的GPT接口来搭建含有私有数据的大语言模型产品。由于微软面向B端的GPT服务为独立部署,不会将私有数据用于大模型训练,从而有效保护私有数据。毕竟,一旦私有数据公开,其价值将大打折扣。

综上所述,大语言模型可以充分释放在解决依赖电脑的自然语言问题、语音问答以及文本翻译等方面的能力,助力各行业获取更大的商业价值。

随着技术的不断发展,重复性劳动的生产力有了进一步提升。在接下来的3年内,我认为业务运营模式将呈现如下图所示:

在这个模式中,企业将基于以下三个能力,孕育出三大类角色:

①问题分解者

这类角色深谙大语言模型能力的边界,能够将一个业务问题有效地分解为GPT能够处理的子问题,并根据问题结果将子问题进行拼装。

②提示工程师

这类角色熟知与GPT沟通方式,能够针对不同的问题类型提供有效的提示词模板,从而极大地提高GPT的输出质量。

③知识拥有者

这类角色拥有丰富的行业知识,能够将知识进行结构化,并传授给GPT。这些人对应现今的领域专家。

通过这种模式的推动,GPT将成为企业效率提升的重要助手,可以解决大量重复性劳动,从而让人们将更多的时间投入到创造性的工作中。

虽然人工智能技术如GPT-4能够提供有价值的参考,但人的主观能动性仍然是起决定性作用。

即使以GPT-4为代表的AI技术保持当前的水平,其提升效率的能力也已经令人惊讶,更何况它仍在以飞快的速度进化。基于技术的发展历史,一项大幅度提高效率的新技术通常会先惠及B端,然后才慢慢在C端释放巨大的价值。这是由企业对效率天然的敏感性所决定的。而改变C端用户的行为需要大量的学习成本和场景挖掘,因此滞后效应较强。我们可以通过以下三个例子更好地理解:

1. 在第一次工业革命中,内燃机的出现导致许多纺织女工失业,但随后内燃机才逐渐应用于各种C端场景,推动了社会生产力的大幅提升。

2. ChatGPT可以更快地生成口水文,但是C端用户对阅读的需求并没有增加。对于营销号公司来说,效率提高了,但所需人数却变得更少了。

3. MidJourney可以快速生成抱枕的图案,但C端用户不会因此购买更多的抱枕,这意味着需要制作图案的人数可能会减少。

因此,尽管人工智能技术能够提供强大的辅助支持,但人的主观能动性仍然起着决定性的作用。

综上所述,虽然人工智能技术在带来效率提升方面发挥着重要作用,但我们应该清楚地认识到其局限性,以便更好地应用它们,使其与人类主观能动性相得益彰,共同推动社会的进步与发展。

信息化企业即将迎来一场内部效率的改革,因为电脑可以使用大模型来完成重复性劳动。正如我在文章开头所提到的案例,类似IBM公司缩减7800个编制的情况将会越来越普遍。

AI时代已经到来,每个岗位都需要思考如何让AI成为我们的工作伙伴。

利用人工智能的大模型,我们可以让电脑帮助我们完成重复性劳动,从而提高工作效率。伴随AI时代的到来,许多公司都会缩减编制,实现内部效率改革,这是一个不可避免的趋势。

每个岗位都需要重新思考,如何利用人工智能技术,让它们成为我们的工作伙伴,与我们共同改进工作流程,提高工作效率和质量。这是一个巨大的挑战,也是一个巨大的机遇,我们应该积极思考和探索,以便更好地利用这一新技术。