最近ChatGPT 终於推出官版App,5月底已可在台湾地区的iPhone App Store上下载!但有许多诈骗版本,请认明官方推出的 ChatGPT App。据第一波实测人士表示,这个行动版更实用,例如用讲的就能下指令。另外 ChatGPT网页版也有新功能!可分享对话给朋友;外挂Plugins也已可试用。OpenAI这些更新到底怎麽用?《远见》一文完整解析。
近期OpenAI宣布,美国推出ChatGPT的App,优先开放给iOS系统用户使用,现在台湾地区iOS App Store也能下载。不过,并不是所有 iPhone 用户都能抢先体验,因为下载 ChatGPT 的 app 还有版本限制。根据第一波用户表示,手机版桌机串接很方便,但是要小心诈骗,因为下载排行榜上,山寨ChatGPT盛行,请认清楚下方图片官版App才能安装。
除了登陆Android手机以外,ChatGPT的下一步是什麽?根据执行长奥特曼(Sam Altman)说法,包含提高输入文字的上限、增加记忆上下文的容量,还会努力降低成本,变得更便宜。现在ChatGPT的付费用户可以在GP3.5 和GPT-4模型之间切换、使用外挂程式(plugins),还能将对话分享给其他人。要怎麽使用ChatGPT的外挂?现在有谁能下载ChatGPT的app?GPT-4比GPT-3.5厉害在哪里?《远见》一文带你看。
图/下载OpenAI官方推出的ChatGPT应用程式,请认明正版。取自App Store。
目录
●OpenAI推出ChatGPT的app,有谁可以用?
●ChatGPT 下一步?更便宜、记忆上下文、提高输入上限
●分享ChatGPT对话给朋友无缝接轨,新功能如何使用?
●一键订餐、上网查资料,ChatGPT新功能要到哪里试用?
●GPT-4已正式开放试用,要付费才行?
●GPT-4有什麽最新应用?
●GPT-4与GPT-3.5相比,升级在哪?
●GPT-4看图说故事新功能开箱
●让GPT-4更强大的多模态模型是什麽?为何这样的AI模型将拥有自主权?
●GPT-4以後升级,还将让AI拥有「听觉」,甚至嗅觉与触觉?
●GPT-4缺陷:更快更好以外,还是有偏见
OpenAI推出ChatGPT的app,有谁可以用?
美国时间5月21日,OpenAI在其官网上正式宣布推出ChatGPT的应用程式,让大家在手机上也能玩转ChatGPT,5月31日起也在台湾地区开放上架。
虽然现在只有开放给iOS使用者。不过,Android手机用户不用太难过,OpenAI在声明中表示,很快就会推出给安卓使用者的ChatGPT应用程式,只要耐心等候,春天就会到来。
在OpenAI的文章中,有提到几个ChatGPT App的重点,包含:
1. 跨桌机与行动等多元装置同步对话纪录。
2. 支援OpenAI开发的语音辨识模型Whisper,它能够将用户的声音命令转化为文字,传输到ChatGPT当中。
3. 若你订阅ChatGPT付费版Plus的使用者,在App中能够享受同样的权利,包含切换到GPT-4模型、来回对话的速度更快、体验新功能等。
4. 客制化推荐:App版将更能针对你的需求,帮你打造旅游行程或推荐食谱。
无论是 iOS 版的 App Store,或者是 Android 版的 Google Play,搜寻「ChatGPT」,都会有许多以 Chat、GPT、AI聊天为名的应用程式,因此要注意 2 个重点,第一是若想要使用官方版本,则下载时要认明应用程式是否由OpenAI出品,以免遇到山寨版的ChatGPT;第二是若不那麽在乎是不是官方版本,要注意是否收费、开发应用程式者的背景、其他使用者的评论,以免得不偿失。
ChatGPT 下一步?更便宜、记忆上下文、提高输入上限
据人工智慧新创 Humanloop 共同创办人哈彼得(Raza Habib)上周对 OpenAI 执行长奥特曼(Sam Altman)的采访,OpenAI 近期的产品路线图(near-term roadmap)包含以下几点:
• 让GPT-4变得更便宜、速度更快:
OpenAI 希望尽其所能地降低「智慧成本」(the cost of intelligence),如此一来API 的使用者可以用更低廉的价格调用。奥特曼强调,这是他们的首要任务。
• 提升对於上下文掌握的长度:
使用 ChatGPT 或者呼叫 GPT 的 API时,都有对话长度的限制,若超过上限,系统便会忘记过往的交谈内容;GPT-4 模型释出後,用来计算对话长度的指标 token 数值已经从 4 千翻了数倍,来到 3万2千,未来 OpenAI 期望可以一举提高到 1百万个 token,野心不可谓不大。
• 将微调模型 API 扩充到最新版本:
过往 OpenAI 有提供让使用者能够微调(fine-tune)自己模型的 API,但新版模型还无法调用,OpenAI 打算完成这项任务。
• 能够「拥有记忆」的 API:
使用 API 时,我们时常会提供先备知识、设定情境给 GPT,每次使用都要付一次钱、重新让它掌握对话脉络,OpenAI 预计开发出能够记下对话历史的 API。
分享ChatGPT对话给朋友无缝接轨,新功能如何使用?
ChatGPT 在美国时间 05/31 新增让用户分享对话的功能,无论是付费使用者或是免费用户,都能把自己和 ChatGPT 的对话转化成连结,若想要了解更多,可以参考 OpenAI 的官方文章。
具体来说,要怎麽把ChatGPT的对话分享给朋友?
• 步骤01:选择对话名称後,点击中间的按钮。
• 步骤02:稍後片刻,ChatGPT 就会产出对话连结,按下复制按钮。
• 步骤03:将连结分享给朋友,朋友将连结贴上网址列後进入,就可以从你对话结束的地方继续和 ChatGPT 对话了。
图/从和ChatGPT的对话中,左边有三个按钮可以点击,中间的可以连到对话历史。
图/点击复制按钮,就可以把和ChatGPT的对话分享给他人。
一键订餐、上网查资料,ChatGPT新功能要到哪里试用?
部分订阅ChatGPT Plus的用户,若是运气不错,已经能够在ChatGPT使用外挂程式(plugins)了。要到哪里去找呢?只要先点击ChatGPT页面左下方的个人帐户,再从中选取设定(settings),接着就会跳出选单,有3个选项可供选择。
图/设定页面中有3个选项,其中第2个选项就能试用连网功能与外挂功能。取自ChatGPT设定页面
• 第1个「整体」(general)选项可以让人调整主题,使用者能在夜晚、明亮、系统等模式中切换,还能清除过往的对话纪录。
• 第2个「测试功能」(beta features)选项提供了2个功能:网页浏览功能与外挂程式。前者可以让ChatGPT连上网路,浏览网页资讯後回答问题,这可以弥补ChatGPT训练资料只有到2021年的问题;後者则让使用者可以使用众多外挂,例如获取市场最新的交易资料、蒐集食谱与食材、寻找可有空位的餐厅等,若看到喜欢的点击安装後,就能在与ChatGPT对话中启用。
• 第3个「资料控制」(data control)选项,可以让使用者汇出资料、删除帐号、开启2阶段验证,此外还有最重要的,是否要储存与ChatGPT对话的资料,若要储存的话,就会被OpenAI拿来训练ChatGPT的表现。如果选择不储存资料,这些对话就会在30天内被删除。
图/外挂没有开放给全部的ChatGPT Plus订户,仅让部分用户试用。取自ChatGPT外挂页面
GPT-4已正式开放试用,要付费才行?
OpenAI在ChatGPT官网中,让有订阅ChatGPT Plus的人能够优先使用GPT-4驱动的问答。实际使用下来,在执行任务例如翻译时,GPT-4的速度略慢於3.5,但是表现较佳,订阅用户可以自行选择想要使用哪一个版本;不过,若是要启用上述的连网与外挂功能,一定要选择GPT-4版本。
另外,由於微软已将GPT-4融入自家搜寻引擎Bing中。所以你也可改用Bing的Copilot聊天服务,就等同免费使用GPT-4。至於GPT-4的API,现在OpenAI开放了等待表单,未来使用者可以依照呼叫API的次数付费。在文章最後,OpenAI表示,它们期待GPT-4能够成为改善们生活的重要工具,它们也会持续改善这个模型。
图/订阅ChatGPT Plus的用户,可以自由选择GPT3.5与GPT-4。取自ChatGPT对话
OpenAI官网GPT4发表网址:https://openai.com/research/gpt-4
GPT-4有什麽最新应用?
美国非营利教育机构可汗学院(Khan Academy)宣布,推出建立於GPT-4之上的线上家教「Khanmigo」,学生可以学习不同科目,因为GPT-4大语言模型的特性,能够生成巧妙的文字对话,有一定的创造力,同时可汗学院又巧妙设计出学习中的不同活动,例如和老师针对特定议题展开思辨、与书中或是历史人物聊天、写习题等应用。
摩根史坦利(Morgan Stanley)则是将内部财富管理的相关知识与累积的洞见,喂给GPT-4模型,藉此打造专业的AI理财专员,向它提问时,AI理专会从广袤的知识库中寻找正确的解答。
GPT-4与GPT-3.5相比,升级在哪?
跟过往的GPT-3.5相比,GPT-4变得更快、更好、更精准、更道德、更能够依照使用者需求客制化,虽然它仍有局限,例如还是会无中生有、犯下推理错误、被使用者的虚假陈述所骗,但在OpenAI的调校下,GPT-4的安全性有所提升,针对敏感提问如制造武器、医疗谘询等,还有生成有问题的程式码、会伤害人的建议,GPT-4皆有所进步。
OpenAI指出,若只是随意聊天,GPT-4和先前的模型没有很大差异,当任务变得复杂时,就能见识到GPT-4的惊人之处。在回答奥林匹亚(Olympiad,国际解题竞赛,各国会派出优秀学生参与)和美国大学预修课程(AP,Advanced Placement)的试题时,GPT-4模型的表现大幅胜过GPT3.5。
举例来说,在统一律师资格考(Uniform Bar Exam)中,GPT-3.5的PR值大约为10,但GPT-4的PR值高达90;法学院入学考试(LSAT)的结果类似,GPT-3.5 PR40,GPT-4 PR88。即使是英文以外的语言,GPT-4的表现也赢过GPT3.5和DeepMind的龙猫大语言模型(Chinchilla)、谷歌的PaLM模型。另外,美国一位身兼医生与电脑科学家身份的柯汉(Isaac Kohane),表示在实测过後,发现GPT-4驱动的新版ChatGPT能够答对美国医学资格考90%以上的题目,甚至还能够诊断出发生率仅有10万分之一的的疾病。
除了成绩进步以外,OpenAI提升了GPT-4的可控制性(steerability)。我们平常使用的ChatGPT,说起话来温文儒雅、客气万分,如今只要使用者先描述想要使用的ChatGPT风格,便能够和换装後的ChatGPT对话,例如苏格拉底式的ChatGPT,就注重引导、不会直接给学生答案。
图/OpenAI请GPT-4模型以苏格拉底风格教学,绝对不能给学生答案;相反地,还要不断提出好问题帮助学生思考。ChatGPT果真循循善诱,以提问代替直接回答。取自OpenAI官网
GPT-4看图说故事新功能开箱
过往的GPT模型只能接受文字,然而,GTP-4这次最惊人之处,就是它不只能够读取文字指令,GPT-4还能够「看懂」图像。
能够「看懂」图像,代表使用者可以将图片交给模型判读,无论是学生常见的看图写作文、根据图表解释情况,或者是生活中可能用到的相片命名分类,还有工作会用到的图像素材贴标,这些都难不倒GPT-4模型。
图/OpenAI请GPT-4模型解释上图的不寻常之处,模型指出有个人在移动中的计程车後方架子上烫衣服。取自OpenAI官网
让GPT-4更强大的多模态模型是什麽?为何这样的AI模型将拥有自主权?
GPT-4之所以能学会看图说故事,也在於它和GPT-3.5最大不同点是,它是一个多模态(MultiModel)模型。
到底,什麽是多模态模型?事实上,OpenAI先前就曾发表类似技术,也就是同样属於多模态预训练模型的CLIP(Contrastive Language-Image Pre-Training),它能够自动分辨图片之间的差异,即使没有文字标签,使用者也可以输入文字搜寻想要的相片,完全整合了文字与图像两种不同的资料类型。OpenAI类似Midjourney的文字生成图像DALLE·2,便是运用了CLIP的技术。
谷歌大脑(Google Brain)专攻深度学习的研究总监艾克(Douglas Eck)也曾表示,多模态人工智慧模型将会带来最新的突破;DeepMind的研究总监哈德席(Raia Hadsell)也对多模态模型感到兴奋,他更大胆预言,未来我们可能见到人工智慧模型能够自由探索、拥有自主权、跟环境互动。
当然,GPT-4现在仅具备读懂图像和文字的能力,另外,它输出的内容也只有文字,但OpenAI早就有影像生成的服务,是否要将其整合到GPT-4的新版模型中,只是OpenAI策略上的决定,要做与不做而已。
图/OpenAI请GPT-4模型针对图表,计算美国乔治亚州,和西亚(West Asia)平均每日肉品消费的加总值,且要求模型提供逐步的推理过程,这也没有难倒它。取自OpenAI官网