您当前的位置:首页 >  快讯  > 正文
今日快看!计算机行业专题研究:GPT&智能终端 大模型定义新入口
来源:华泰证券股份有限公司     时间:2023-04-06 18:41:51


【资料图】

以机器人为突破口,ChatGPT 等大模型定义智能终端新入口2023 年2 月,微软提出了ChatGPT for Robotics,利用ChatGPT 解决机器人应用程序问题。在此过程中,不要求LLM(大语言模型)输出特定于机器人平台或库的代码,而是创建简单的高级函数库供ChatGPT 调用,并在后端将高级函数库链接到各平台、场景和工具的现有库和API。结果表明,ChatGPT 能够以zero-shot 的方式解决各种与机器人相关的任务,对于zero-shot 无法解决的问题,用户也可以采用交互对话的形式对ChatGPT 实行进一步指导。以人形、协作机器人为突破口,ChatGPT 等LLM 将成为智能音箱、车载虚拟助手等智能终端设备新入口。

人类on-the-loop 指导ChatGPT 操纵机器人

ChatGPT 的引入,使得人类用户脱离in-the-loop,转以on-the-loop 的形式,通过自然语言等高级语言命令与语言模型交互,实现无缝部署各种平台和任务,并对ChatGPT 输出的质量和安全性进行评估。其中,定义高级函数库与构建提示是关键:前者通过调用机器人平台API 赋予ChatGPT 操纵机器人的能力;后者通过描述约束&需求、环境、当前状态、目标、方案示例等,更好的指导ChatGPT 生成结果。微软还提供专门的PromptCraft 和AirSim仿真平台辅助开发者进行机器人方面的研究。

ChatGPT 分三个层次解决不同复杂度的机器人问题对于简单的机器人任务,例如时空推理、无人机飞行和AirSim 工业检测等,ChatGPT 能够以zero-shot 的方式解决,不需要提供额外的代码示例。对于较为复杂的任务,例如课程学习和AirSim 避障,ChatGPT 无法zero-shot解决问题,人类用户on-the-loop 与ChatGPT 进行交互,可以辅助其完成相关任务。以上两类任务的完成均依赖ChatGPT 生成的代码,而更高层次地,用户通过文本对话不断将人类的感知信息输入到ChatGPT,ChatGPT 能够解析观察流并在“对话系统”中输出相关操作,不再需要生成代码。

LLM 定义机器人、智能音箱、车载助手等新入口微软的ChatGPT for robots 开启了ChatGPT 的设备入口属性。1)机器人入口:谷歌的PaLM-E 具身多模态模型同样实现了对机器人的控制;OpenAI从2017 年即开始在机器人领域布局,2023 年3 月领投挪威的人形机器人制造商1X technologies。2)智能音箱&家居:国外智能家居提供商Josh.ai提供了与ChatGPT 结合的使用示例,阿里大模型联合项目团队在天猫精灵智能音箱上部署了个性化消费级终端模型。3)车载助手:通用汽车正开发基于ChatGPT 的虚拟个人AI 助手,毫末智行预告了DriveGPT。

相关标的

大模型的“新入口”属性已经从主流的PC 和手机端,向更广泛的智能设备扩散。我们认为,主要的智能设备包括智能终端和智能音箱,相关标的包括:

1)智能终端:科大讯飞,萤石网络,中科创达;2)智能音箱:国光电器,漫步者,惠威科技;3)机器人:石头科技;4)银行超级柜台:新北洋。

风险提示:宏观经济波动,技术进步不及预期。本报告内容均基于客观信息整理,不构成投资建议。

标签:

相关新闻
精彩推荐