当前位置: 首页 >> 人工智能

GPTs超前体验：AI大众化的转折点？

作者：韩子文

来源：酷玩实验室

时间：2024-01-08 11:27

很多年以后，当人们回顾刚刚过去的2023年，大概会把它记为人类的“AI元年”。

去年一整年，生成式AI的发展如浪潮汹涌，其中最大的明星就是ChatGPT了。3月初ChatGPT4.0版本惊艳亮相，随后不断推出新功能：联网搜索、插件、语音对话等等等等。到了11月6日，山姆·奥特曼在洛杉矶举办的OpenAI首届开发者大会上，发布了今年最重磅的更新：“GPTs”，被称为AI走向大众化的关键一步。

这里我带大家简单回顾一下啥是“GPTs”。

ChatGPT发展到去年年底的时候，周活跃用户已经超过一个亿，但这一个亿的用户是以程序员，内容创作者这些专业用户为主，远没有走进千家万户。

问题出在什么地方呢？

就是因为ChatGPT这种聊天对话框的交互形式，它不像社交软件、电商软件或者短视频软件那样，指向一个具体的服务，大家不知道用它来干嘛啊。

就好比给你一台智能手机，把App全删了就给你留个Siri或者小爱同学，那怎么用啊？

而GPTs就是一个大家可以根据自己的需求定制的ChatGPT，或者说白了非常类似于智能手机里的App。只不过它的开发过程极其简单，基本不需要会编程。所以这个GPTs的开发非常踊跃，短短两个月时间用户已经发布了将近10万个GPTs。

那既然有了App，下一步就是要上线一个类似App商城的平台了，OpenAI把它称为GPTstore，原计划在11月就要推出。但是后来就发生了众所周知的OpenAI高管宫斗事件，搞得这都2024年了，GPTstore连个影子都没有。

那这段时间大家做的GPTs怎么样呢？是否存在可能引爆市场的应用呢？

虽然官方的GPTstore没有上线，但好在有人做了第三方平台。比如GPTsHunter，它就收录了超过9万个GPTs，最近几天，我去试玩了其中的部分的GPTs，发现还是有一些很有意思的。

比如一打开它的推荐列表，我一眼就看到这个X的图标，有人用ChatGPT做了一个马斯克的Grok AI。有意思，这不是搞NTR吗？

去搜了一下才发现，居然有整整一页的Grok AI。。。

随便挑一个问了下“马斯克是个怎么样的人？”

美国国草扑面而来，这纯纯就是来整活的。

还有人做了一个武侠背景的文本冒险游戏，叫《武林秘籍：江湖探险》。

有点像当年Dos时代玩的文本冒险游戏，只不过它的每一个场景和配图都是由ChatGPT生成的。

配图有种像素游戏的感觉，我现在有100金币，绝世武功还没有学会，看来可以通过数字选项进入下一步，那不如，我就选1吧。

这里我选择1，去跟老者交流学习，结果几步之后内功果然有了长进。但是又过了几步，他居然还是不肯把《道心种魔大法》传授给我。

那就不要怪我无情了！

4个选项我都不选，我直接打字下指令，强迫师傅教给我《道心种魔大法》。

可惜他给我绕了个圈，最后还是给出了跟上一轮一模一样的选项，看来目前的设定就是没办法学习到《道心种魔大法》。但是我注意到，文本内容并没有发生重复，可见这种AI生成式的文字冒险游戏是有挺多可能性的。

不过因为ChatGPT4.0的个人版是有使用量的限制的，目前是3小时40条，如果一次玩太久，ChatGPT就暂时无法使用了，这给我通关制造了很大的阻力。

目前我只打出了一个平凡结局，按照设定的话应该是有多结局的，如果有多周目的高玩，欢迎来评论区跟我分享下其他结局。

接下来我们试玩下DALL·E。

DALL·E可以说是目前GPTs当中访问量最高的一个了，毕竟是官方推出的GPTs。

GPTs版本的DALL·E与ChatGPT4.0集成的版本有稍许不同，GPTs的DALL·E每次可以生成两幅画，方便进行选择。

DALL·E相比其他的图片生成软件最大的优势就是，你不需要提供严谨的提示词，它就可以生成效果不错的图片。虽然相比MidjourneyV6最新版本，在生成图片的质量上逊色一些，不过这种提示方式的可玩性实在是高出太多了，所以大家经常用它来整活。

我试了好几个主题，发现到最后推到极致，DALL·E画出的图片都会跟宇宙跟繁星有关，果然星空才是想象力的极限啊！

我们再来玩一个学习类的GPTs。

Mr·Renedeer驯鹿先生，是由一个17岁的澳大利亚高中生开发出来的。你可以用它来学习任何学科，学习的内容和难度也可以任意指定。试玩之后我觉得，它对于那些需要迅速了解某个特定领域的人来说，还是挺有用的。

首先需要在对话当中设置语言，我们输入“/language Chinese”选择中文。

然后是设置我们的偏好，这里分得非常详细，设定完之后就可以开始学习了。

比如说，最近中东地区热点事件一件接着一件，搞得我很想学习中东历史。

通过“/plan”输入，驯鹿先生就会为你量身制定一个学习计划。

不知道各位怎么看？我觉得这个目录还是相当有条理的。

当这一节课学完之后，输入“/continue”就会进入下一课。

在学习的过程中，你可以随时地提出问题。

除了主要学科之外，还有很多其他学科的知识也可以学习，比如想要学习编曲方面的知识。

你甚至可以用它来学习魔兽世界的历史故事。

哇，可以用文字的方式重新回顾艾泽拉斯了。

可以看出，驯鹿先生最擅长的就是“结构化的输出”，就好像雪花的晶体结构一样，他每次输出的内容都是一样的结构，一层一层向深处延伸，这样一来每一层涉及的知识量不会太多。

如果你对这一条不是很感兴趣，可以只看一层了解个大概；如果你特别感兴趣，可以往下挖它一百层进入非常深度的领域。

而且相对于传统的教科书，你可以在任何位置选择深入挖掘或者打断提问，灵活性也高了不少。

在使用的过程中我有种感觉，虽然驯鹿先生这样的GPTs体验已经不错了，但是目前网页对话的这种形式，还是大大限制了它的潜力，如果能把学习内容的大纲固定地放在网页一边，并且标注上学习进度，那么整体的体验还会更上一层楼。

“驯鹿先生”的作者也在筹划制作一个网页版，借助ChatGPT4.0这颗强悍的大脑，想要实现这个功能应该不会太难，未来可以期待一下。

因为时间关系，今天的GPTs就先演示到这里。目前绝大多数的GPTs还处在初级阶段，几乎都是使用GPT Builder对话创建的，包含了大量的聊天机器人，像是心理健康助手，讲故事机器人，翻译机器人等等。

而要创建一个更有深度的GPTs就需要一定的编程技术了，因为目前GPTs可以设置的部分有三个方面。

1）提示词，也就是给ChatGPT预先下一些指令，比如“请用老师的口吻说话，每段都要用总-分-总的结构”

2）知识库，也就是输入一些知识文档，比如把小学到大学的物理习题集输进去

3）动作Action

而大部分的GPTs只用到了前面两步。

提示词和知识库比较简单，我们平时用ChatGPT也会输入，而动作Action类似程序员一般说的那个调取API，通过设定Action，GPTs可以调用其他软件的功能和服务，执行更复杂的任务。比如使用ChatGPT去同步Google日历的内容。

再比如有一个GPTs叫Zapier，它是一个类似按键精灵的自动化工作流平台，可以支持调用6000多个软件，包括：Gmail、微软全家桶、Slack、notion、Google Sheets 等等。

比如可以让Zapier去网站上搜集关于“pikaAI视频工具”的内容，出一个研究报告，然后自动保存到Notion笔记本当中。

虽然这个GPTs只是调用了一下浏览器和笔记本的功能，但是实现得确实挺像那么回事的。从此以后，我们的AI助手就可以操作不同的软件，去帮我们完成任务了，这离钢铁侠的那个贾维斯又近了一步啊。

最后聊聊我试用之后的感受。

首先，现在的GPTs还在初级阶段，大部分都是聊天机器人，跟普通的ChatGPT区别不大。不过因为有了第三方平台，通过排行榜的推荐，一些比较优秀的GPTs就能被普通用户发现了，比如驯鹿先生。

第二点是，目前GPTs用的最多的交互形式，还是聊天对话框，感觉这对于它能实现的功能还是有很大限制的，因为聊天对话框并不适用于大部分的场景，比如抖音这种只需要一个上划就可以使用的App它就取代不了。我觉得大概率还是需要有优秀的制作团队来帮大家探索，打个样，ChatGPT还有哪些潜在的交互形式。

第三点，在目前交互形式受限的情况下，OpenAI也给出了他们自己的答案，就是搭配其他的软件一起使用，让GPTs成为一个发布命令的中枢，去接入其他更多软件或服务，这样才能离真正的AI助手更近一些。

试用完这堆GPTs，让我看到了大模型应用扩展的潜力，相信随着OpenAI还有别的大模型厂家发布它们的应用商城，大模型会很快进入寻常百姓家，比去年更汹涌的AI浪潮将在2024年卷土重来。

免责声明：本文系转载，版权归原作者所有；文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担；旨在传递信息，不代表钛狐网观点和立场。

今日热门