手机数码

智能黑电

电脑办公

智能白电

手机数码

生活电器

汽车生活

智能家居

大数据

机器人

物联网

人工智能

游戏

5G

VR/AR

奥维云网

中怡康

互联网

广告

ChatGPT大火,AI语音助手似乎有救了?
2023-03-14 13:46 文章来源:天极网 作者:云隐 点击:

继区块链、元宇宙之后,ChatGPT突然之间也火了,近段时间以来,似乎每个行业都在聊ChatGPT。于是,以ChatGPT为代表的生成式人工智能,再次席卷整个互联网行业,有学者更将其称之为“思维变革”,认为它会在未来逐渐改变人类思考和处理问题的方式,甚至带来颠覆性的变革,并由此重塑整个世界。

ChatGPT大火,AI语音助手似乎有救了?

  什么是ChatGPT?

  ChatGPT(Chat Generative Pre-Trained Transformer,聊天生成式预训练转换器)是人工智能公司OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成撰写邮件、文案、视频脚本、代码等一系列任务。

  从功能性来看,ChatGPT作为一款生成式人工智能工具,直接冲击的肯定是“搜索引擎”这类常用工具,其具备搜索引擎所不拥有的准确整合信息、高效产出内容等优势,能够大幅提高学习与办公的效率,发展到一定程度完全有可能会取代传统的搜索引擎。

  基于它有庞大的数据库做支撑,并且能够迅速准确地给予用户反馈,这不禁让我联想到AI语音助手。从某种程度上来看,ChatGPT与AI语音助手有着相似的地方,都是对话类型的聊天工具,区别在于唤醒方式,一种是文字,一种则是语音。

ChatGPT大火,AI语音助手似乎有救了?

  陷入尴尬困境的AI语音助手

  如果你用过AI语音助手,那么你肯定会和我持一样的观点:“它真的很难用”。

  纵观如今市面上的AI语音助手,主要有Siri、小爱同学、小度、天猫精灵等这几款主流的AI语音助手,被用在手机、电脑、电视、音箱等多种电子产品上,也是串联起各种智能家居产品的中枢。但是,从用户的实际使用体验来说,它们确实不怎么样。

  一方面,AI语音助手的识别度不高。单从唤醒方式来说,有的语音助手呼叫几遍,它都没有反应,例如:苹果的语音助手Siri,有时候需要连续呼叫几次,才会唤醒成功。而有的语音助手,时不时就自动被唤醒,例如:小米的语音助手小爱同学,半夜自动唤醒,可能还会自动播放音乐。

  另一方面,它们依赖的数据库不够完善。通过语音进行提问,所提供的答案基本不准确,答非所问,甚至还会回复“我不知道”、“我不清楚”之类的话语。当然,这其中不排除有版权限制的因素,但其内在的逻辑自然是令人很费解的。

  用户的使用体验不佳,自然也就逐渐失去了交互的兴趣。厂商也明白这一点,慢慢地将AI语音助手转向功能性的开发,通过简单的指令来简单控制智能家居,实现产品之间的联动,倒是有了新的成效,但也仅此而已,指令识别偶尔也会失误。

  对比之下,我们不难发现,AI语音助手的处境属实比较尴尬,完全处于半抛弃状态,没有多少用户会去使用它,与ChatGPT更是不可同日而语。那么,很多人可能会认为,既然ChatGPT如此强大,那是否会取代AI语音助手?

  答案自然是否定的。在我看来,虽然两者存在一定的相似度,但AI语音助手与ChatGPT是两种不同形态,且发展方向的产品。AI语音助手旨在帮助用户通过语音唤醒,获得更为便捷高效的功能需求,尤其是针对老人、孩子这种对于文字输入、触控交互有难度的特定用户,有着ChatGPT不能比拟的简单、易上手等特性。同时,ChatGPT它是基于互联网而形成的聊天工具,存在于虚拟层面,无法像AI语音助手那样,跟现实的智能家居产生联动,自然也就不存在谁替代谁。

  不过,ChatGPT的出现,倒是为AI语音助手提供了一条全新的发展思路:我们是否能够采用ChatGPT的底层学习逻辑,完成对AI语音助手的优化,让其变得更加智能化?

ChatGPT大火,AI语音助手似乎有救了?

  ChatGPT能否拯救AI语音助手?

  根据相关实验室数据显示,用于训练ChatGPT的数据集至少包含4990亿个词语,覆盖了博客、书籍、新闻资讯、网站等海量内容。有了如此庞大的数据库支撑,ChatGPT才能通过不断地学习,再结合人类的反馈微调,进而逐步提升答案的准确性。具体来看,主要分为以下四个步骤:

  首先,AI学习来自网络的文本数据,汇总相关有可能性的答案;其次,AI能够通过人工构建的问答数据微调模型,更准确地理解人类提问的意图;再者,人工对AI生成的结果进行排序,训练其奖惩模型,使AI模仿人类评分标准给不同的答案进行打分;最后,根据打分来更新参数,强化AI学习,训练AI得出高质量的答案。

  在我看来,这种底层的学习逻辑,本质上还是一种学习与训练的过程。只不过,ChatGPT仅需构建一个模型即可完成几乎所有内容的学习。它相比起那些面对不同的领域需要构建不同的模型,并且学习时间很长的AI来说,确实来得更加高效便捷。

  所以,从ChatGPT底层的学习逻辑来看,它对于AI语音助手来说有着一定的借鉴意义。我们完全可以通过ChatGPT强大的自然语言理解和沟通能力,来改善如今极其不好用的AI语音助手。

  其实,自从ChatGPT爆火之后,各大科技巨头均在生成式人工智能领域有所布局,其中不乏对于AI语音助手的尝试性优化。例如:2月初,小度官宣AI语音助手小度未来将会融合百度文心一言的全面能力,打造针对智能设备场景的人工智能模型“小度灵机”,并应用到小度全系产品。

  由此来看,借助ChatGPT来优化AI语音助手的设想,其实具备较高的可行性。如果能够让AI语音助手达到ChatGPT的学习逻辑能力,那么现在被吐槽得一无是处的AI语音助手,将会成为用户日常生活或工作中,真正高效智能的助手,其用途的广泛性也会再一次得以彰显。

ChatGPT大火,AI语音助手似乎有救了?

  写在最后

  ChatGPT的诞生,很多人都忧心忡忡,认为它会让很多以内容创作为主的从业者面临失业的困局。即使是微软CEO纳德拉也认为,对于知识型工作者来说,这不亚于一场工业革命。

  作为同样以内容创作为主的从业者,我觉得并不需要过分担忧。从它的内容选择上来看,ChatGPT是从庞大的数据库中获取最优解,而并非人自由意志的选择,具备同质化的倾向,而这也不是社会发展所需。简而言之,以ChatGPT为代表的生成式人工智能缺乏人的创造性。

  另一方面,ChatGPT改变的只是人类思考和处理问题的方式,并未限制人的思维。所以,ChatGPT并不会淘汰所谓的内容创作者,它只会淘汰不懂得利用工具的平庸者。毕竟,对于人类发展而言,创造性地提出问题远比如何回答好问题要来得更重要。

织梦二维码生成器
0