当前位置: 首页 >> 人工智能

GPTs超前体验:AI大众化的转折点?

作者:韩子文 来源:酷玩实验室 时间:2024-01-08 11:27

很多年以后,当人们回顾刚刚过去的2023年,大概会把它记为人类的“AI元年”

去年一整年,生成式AI的发展如浪潮汹涌,其中最大的明星就是ChatGPT了。3月初ChatGPT4.0版本惊艳亮相,随后不断推出新功能:联网搜索、插件、语音对话等等等等。到了11月6日,山姆·奥特曼在洛杉矶举办的OpenAI首届开发者大会上,发布了今年最重磅的更新:“GPTs”,被称为AI走向大众化的关键一步。

图片

这里我带大家简单回顾一下啥是“GPTs”。

图片

01

ChatGPT发展到去年年底的时候,周活跃用户已经超过一个亿,但这一个亿的用户是以程序员,内容创作者这些专业用户为主,远没有走进千家万户。

问题出在什么地方呢?

就是因为ChatGPT这种聊天对话框的交互形式,它不像社交软件、电商软件或者短视频软件那样,指向一个具体的服务,大家不知道用它来干嘛啊。

就好比给你一台智能手机,把App全删了就给你留个Siri或者小爱同学,那怎么用啊?

而GPTs就是一个大家可以根据自己的需求定制的ChatGPT,或者说白了非常类似于智能手机里的App。只不过它的开发过程极其简单,基本不需要会编程。所以这个GPTs的开发非常踊跃,短短两个月时间用户已经发布了将近10万个GPTs。

图片

那既然有了App,下一步就是要上线一个类似App商城的平台了,OpenAI把它称为GPTstore,原计划在11月就要推出。但是后来就发生了众所周知的OpenAI高管宫斗事件,搞得这都2024年了,GPTstore连个影子都没有。

那这段时间大家做的GPTs怎么样呢?是否存在可能引爆市场的应用呢?

虽然官方的GPTstore没有上线,但好在有人做了第三方平台。比如GPTsHunter,它就收录了超过9万个GPTs,最近几天,我去试玩了其中的部分的GPTs,发现还是有一些很有意思的。

图片

比如一打开它的推荐列表,我一眼就看到这个X的图标,有人用ChatGPT做了一个马斯克的Grok AI。有意思,这不是搞NTR吗?

图片

去搜了一下才发现,居然有整整一页的Grok AI。。。

图片

随便挑一个问了下“马斯克是个怎么样的人?”

图片

美国国草扑面而来,这纯纯就是来整活的。

还有人做了一个武侠背景的文本冒险游戏,叫《武林秘籍:江湖探险》。

图片

有点像当年Dos时代玩的文本冒险游戏,只不过它的每一个场景和配图都是由ChatGPT生成的。

图片

配图有种像素游戏的感觉,我现在有100金币,绝世武功还没有学会,看来可以通过数字选项进入下一步,那不如,我就选1吧。

图片

这里我选择1,去跟老者交流学习,结果几步之后内功果然有了长进。但是又过了几步,他居然还是不肯把《道心种魔大法》传授给我。

图片

那就不要怪我无情了!

4个选项我都不选,我直接打字下指令,强迫师傅教给我《道心种魔大法》。

图片

可惜他给我绕了个圈,最后还是给出了跟上一轮一模一样的选项,看来目前的设定就是没办法学习到《道心种魔大法》。但是我注意到,文本内容并没有发生重复,可见这种AI生成式的文字冒险游戏是有挺多可能性的。

不过因为ChatGPT4.0的个人版是有使用量的限制的,目前是3小时40条,如果一次玩太久,ChatGPT就暂时无法使用了,这给我通关制造了很大的阻力。

图片

目前我只打出了一个平凡结局,按照设定的话应该是有多结局的,如果有多周目的高玩,欢迎来评论区跟我分享下其他结局。

图片

接下来我们试玩下DALL·E。

DALL·E可以说是目前GPTs当中访问量最高的一个了,毕竟是官方推出的GPTs。

图片

GPTs版本的DALL·E与ChatGPT4.0集成的版本有稍许不同,GPTs的DALL·E每次可以生成两幅画,方便进行选择。

DALL·E相比其他的图片生成软件最大的优势就是,你不需要提供严谨的提示词,它就可以生成效果不错的图片。虽然相比MidjourneyV6最新版本,在生成图片的质量上逊色一些,不过这种提示方式的可玩性实在是高出太多了,所以大家经常用它来整活。

图片

图片

图片

图片

图片

图片

我试了好几个主题,发现到最后推到极致,DALL·E画出的图片都会跟宇宙跟繁星有关,果然星空才是想象力的极限啊!

我们再来玩一个学习类的GPTs。

Mr·Renedeer驯鹿先生,是由一个17岁的澳大利亚高中生开发出来的。你可以用它来学习任何学科,学习的内容和难度也可以任意指定。试玩之后我觉得,它对于那些需要迅速了解某个特定领域的人来说,还是挺有用的。

图片

首先需要在对话当中设置语言,我们输入“/language Chinese”选择中文。

图片

然后是设置我们的偏好,这里分得非常详细,设定完之后就可以开始学习了。

图片

比如说,最近中东地区热点事件一件接着一件,搞得我很想学习中东历史。

通过“/plan”输入,驯鹿先生就会为你量身制定一个学习计划。

图片

图片

不知道各位怎么看?我觉得这个目录还是相当有条理的。

当这一节课学完之后,输入“/continue”就会进入下一课。

图片

在学习的过程中,你可以随时地提出问题。

图片

除了主要学科之外,还有很多其他学科的知识也可以学习,比如想要学习编曲方面的知识。

图片

你甚至可以用它来学习魔兽世界的历史故事。

图片

哇,可以用文字的方式重新回顾艾泽拉斯了。

可以看出,驯鹿先生最擅长的就是“结构化的输出”,就好像雪花的晶体结构一样,他每次输出的内容都是一样的结构,一层一层向深处延伸,这样一来每一层涉及的知识量不会太多。

图片

如果你对这一条不是很感兴趣,可以只看一层了解个大概;如果你特别感兴趣,可以往下挖它一百层进入非常深度的领域。

而且相对于传统的教科书,你可以在任何位置选择深入挖掘或者打断提问,灵活性也高了不少。

在使用的过程中我有种感觉,虽然驯鹿先生这样的GPTs体验已经不错了,但是目前网页对话的这种形式,还是大大限制了它的潜力,如果能把学习内容的大纲固定地放在网页一边,并且标注上学习进度,那么整体的体验还会更上一层楼。

“驯鹿先生”的作者也在筹划制作一个网页版,借助ChatGPT4.0这颗强悍的大脑,想要实现这个功能应该不会太难,未来可以期待一下。

图片

02

因为时间关系,今天的GPTs就先演示到这里。目前绝大多数的GPTs还处在初级阶段,几乎都是使用GPT Builder对话创建的,包含了大量的聊天机器人,像是心理健康助手,讲故事机器人,翻译机器人等等。

而要创建一个更有深度的GPTs就需要一定的编程技术了,因为目前GPTs可以设置的部分有三个方面。

1)提示词,也就是给ChatGPT预先下一些指令,比如“请用老师的口吻说话,每段都要用总-分-总的结构”

2)知识库,也就是输入一些知识文档,比如把小学到大学的物理习题集输进去

3)动作Action

而大部分的GPTs只用到了前面两步。

提示词和知识库比较简单,我们平时用ChatGPT也会输入,而动作Action类似程序员一般说的那个调取API,通过设定Action,GPTs可以调用其他软件的功能和服务,执行更复杂的任务。比如使用ChatGPT去同步Google日历的内容。

图片

再比如有一个GPTs叫Zapier,它是一个类似按键精灵的自动化工作流平台,可以支持调用6000多个软件,包括:Gmail、微软全家桶、Slack、notion、Google Sheets 等等。

比如可以让Zapier去网站上搜集关于“pikaAI视频工具”的内容,出一个研究报告,然后自动保存到Notion笔记本当中。

图片

虽然这个GPTs只是调用了一下浏览器和笔记本的功能,但是实现得确实挺像那么回事的。从此以后,我们的AI助手就可以操作不同的软件,去帮我们完成任务了,这离钢铁侠的那个贾维斯又近了一步啊。

03

最后聊聊我试用之后的感受。

首先,现在的GPTs还在初级阶段,大部分都是聊天机器人,跟普通的ChatGPT区别不大。不过因为有了第三方平台,通过排行榜的推荐,一些比较优秀的GPTs就能被普通用户发现了,比如驯鹿先生。

第二点是,目前GPTs用的最多的交互形式,还是聊天对话框,感觉这对于它能实现的功能还是有很大限制的,因为聊天对话框并不适用于大部分的场景,比如抖音这种只需要一个上划就可以使用的App它就取代不了。我觉得大概率还是需要有优秀的制作团队来帮大家探索,打个样,ChatGPT还有哪些潜在的交互形式。

第三点,在目前交互形式受限的情况下,OpenAI也给出了他们自己的答案,就是搭配其他的软件一起使用,让GPTs成为一个发布命令的中枢,去接入其他更多软件或服务,这样才能离真正的AI助手更近一些。

试用完这堆GPTs,让我看到了大模型应用扩展的潜力,相信随着OpenAI还有别的大模型厂家发布它们的应用商城,大模型会很快进入寻常百姓家,比去年更汹涌的AI浪潮将在2024年卷土重来。


分享到
免责声明:本文系转载,版权归原作者所有;文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担;旨在传递信息,不代表钛狐网观点和立场。