最近很火的 ChatGPT 究竟是什么？

摘要：我想，最近许多朋友的生活中，可能或多或少都被 ChatGPT 刷屏了。ChatGPT 其实也不是新事物，它背后的基础，是母公司 OpenAI 在几年前发布的自然语言模型 GPT。对人工智能有所了解的朋友一定知道，OpenAI 于 2018 年发布了...

我想，最近许多朋友的生活中，可能或多或少都被 ChatGPT 刷屏了。

你或许已经看过了许多相关的文章。它们或许从商业角度出发，告诉你 ChatGPT 引发了怎样的商业浪潮；或许从技术角度出发，告诉你 ChatGPT 的原理和技术有多厉害；又或者，直接向你推销各种各样的类似产品，告诉你这些产品多么有前途……但这些，离我们的生活都有些遥远。你可能看了很多文章，依然没有搞明白，ChatGPT 究竟是什么，它跟我有什么关系？

ChatGPT 是什么？

ChatGPT 实际上不是一个新事物。它是2022年11月推出的，刚推出的时候我就使用了，还在知乎发了一条想法吐槽了一下。

没想到，时隔两个月之后，随着微软及一票商业公司的入场，它又开始火了，火得家喻户晓。

那么，ChatGPT 究竟是什么？

从原理上来讲，ChatGPT 其实也不是新事物，它背后的基础，是母公司 OpenAI 在几年前发布的自然语言模型 GPT。对人工智能有所了解的朋友一定知道，OpenAI 于 2018 年发布了 GPT-1，首次让人工智能能够让人类一样「理解文字」、写出文字。

随后几年里，OpenAI 陆续推出了 GPT-2、GPT-3，用更庞大的参数实现了更精细的学习。通俗来说，就是让人工智能更「像人」了。

目前 GPT-3 已经用在了很多场合。像国外已经有用 GPT-3 来写新闻的应用，至于用 GPT-3 写小说、生成游戏台词、生成代码，也都在探索中了。

而 ChatGPT，就是在 GPT-3 的升级版 GPT-3.5 的基础上，进行一定的包装、微调、优化，所做出来的产品。过往的 GPT-3 只是一个底层引擎，必须接入到一个软件中才能使用。而 ChatGPT，可以理解为 OpenAI 自己为 GPT 做了这么一个软件，让用户可以直接使用它。

所以它才叫 ChatGPT，也就是「可以聊天的 GPT」。

那么，GPT 又是什么呢？它的全称是 Generative Pre-trained Transformer，生成式预训练转换器。简单来说，它的原理是：先给它提供一个庞大的语料库（通常是直接从互联网上抓来的），让模型通过上千亿个参数对这些文本进行打散、标记、学习，构建起一个复杂的预测模型。

然后再依据这个预测模型，判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来，形成一段话，或者一篇文章。

这种预测的模式，其实跟我们大脑的学习和加工模式是非常相似的（详见《打开心智》第一章）。因此，这也是它能够更「像人」的一个重要原因。

我们可以用三层模型来理解：

这个模型背后无需人工参与的「无监督」式预训练自学习原理，或者说让模型像大脑「自由生长」的过程，就是它的动力层；借由这个原理所完成的 GPT-3.5，就是一个结构层，是 ChatGPT 起作用的主要基础；而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT，就是一个交互层，它的本质就是加了一层更友好的用户界面和交互方式，让个人用户能够更容易地应用它。

ChatGPT 能做什么？

了解完 ChatGPT 的原理，我们自然会关心一个问题：就目前而言，ChatGPT 究竟能做什么？

1）回答问题。

这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问，比如「波粒二象性是什么意思」，它就会用流畅的语言向你解释，把这个概念讲解得非常清楚。就我试用的体验而言，效果非常好，简洁晓畅，表达能力胜过许多人。