ChatGPT的崛起：发展历程、技术原理以及局限性 - 星际财经

ChatGPT是个啥？

近期，OpenAI 发布了 ChatGPT，是一个可以对话的方式进行交互的模型，因为它的智能化，得到了很多用户的欢迎。ChatGPT 也是OpenAI之前发布的 InstructGPT 的亲戚，ChatGPT模型的训练是使用RLHF（Reinforcement learning with human feedback）也许ChatGPT的到来，也是OpenAI 的GPT-4正式推出之前的序章。

什么是GPT？从GPT-1到GPT-3

Generative Pre-trained Transformer (GPT)，是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

2018年，GPT-1诞生，这一年也是NLP（自然语言处理）的预训练模型元年。性能方面，GPT-1有着一定的泛化能力，能够用于和监督任务无关的NLP任务中。其常用任务包括：

自然语言推理：判断两个句子的关系（包含、矛盾、中立）
问答与常识推理：输入文章及若干答案，输出答案的准确率
语义相似度识别：判断两个句子语义是否相关
分类：判断输入文本是指定的哪个类别

虽然GPT-1在未经调试的任务上有一些效果，但其泛化能力远低于经过微调的有监督任务，因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。

GPT-2也于2019年如期而至，不过，GPT-2并没有对原有的网络进行过多的结构创新与设计，只使用了更多的网络参数与更大的数据集：最大模型共计48层，参数量达15亿，学习目标则使用无监督预训练模型做有监督任务。在性能方面，除了理解能力外，GPT-2在生成方面第一次表现出了强大的天赋：阅读摘要、聊天、续写、编故事，甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后，GPT-2的确展现出了普适而强大的能力，并在多个特定的语言建模任务上实现了彼时的最佳性能。

之后，GPT-3出现了，作为一个无监督模型（现在经常被称为自监督模型），几乎可以完成自然语言处理的绝大部分任务，例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且，该模型在诸多任务上表现卓越，例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平，自动产生的文章几乎让人无法辨别出自人还是机器（仅52%的正确率，与随机猜测相当），更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率，甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好，似乎让人们看到了通用人工智能的希望，可能这就是GPT-3影响如此之大的主要原因

- 星际资讯

免责声明：投资有风险，入市须谨慎。本资讯不作为投资建议。

下一篇：Lens Protocol 空投指南
« 上一篇

上一篇：FTX旗下衍生品交易平台LedgerX正挂牌出售，Blockchain.com和Gemini或为潜在收购方
下一篇 »

相关推荐

Hooked 成为Web3爆款的启示

一览加密风投版图——发现支持早期项目的最佳基金

穿越牛熊的mfers：反脆弱性、文化即效用、无为而治。

ChatGPT 真的会成为谷歌杀手吗？

一文了解 chatGPT 和 Web3 可能的结合点

观点：SBF是华尔街进军加密行业折损的马前卒

Vitalik：以太坊应用生态系统中的什么让我感到兴奋

美国检方和SEC向与FTX合作密切的交易公司索要SBF等关键人员信息

风险投资家Tim Draper：去中心化的加密货币是经济发展的“大好机会”

灰度比特币信托（GBTC）管理的近110亿美元资产在熊市中构成风险

Alameda Research在2021年承担了FTX高达10亿美元的损失

2022年11月DEX交易额重返1000亿美元上方，创下2022年5月以来的最高记录

OpenAI CEO Sam Altman：ChatGPT上线五天用户数突破100万

团结AAVE挑战大空头？又热起来的老DeFi CRV 近日"惊险"复盘

稳定币和其他衍生品的现状分析