2024-06-24
中国门锁网
网络
6032
Alexa,你在偷听我吗?
我总是会问我的Amazon Echo这个问题。虽然它很聪明很方便,但有时过于智能也让人毛骨悚然。因为这种智能设备通常是基于云上的,它会经常从智能门铃等设备将家里的音频或图片发送到互联网上。当然,这也会产生隐私泄露的风险,想想亚马逊或谷歌的转包商坐在一旁听我们家里传送过来的音频片段,或者黑客远程监视我们的孩子,这有多恐怖。
这个问题是结构性的。它融入了当今消费类人工智能的构建和部署方式。大型科技公司都是在这样的假设下运作的:人工智能要想最有效地识别人脸和声音等,就需要深入学习神经网络,而这需要强大的计算能力。我们被告知,这些神经网络需要大量的数据,需要源源不断地输入数据来提高它们的智能水平,所以它必须在云端发生,对吗?
不是这样的。在20世纪20年代初,当复杂的消费者神经网络首次出现时,这些观点还能站得住脚。那时候,如果你想自动识别小猫,你确实需要谷歌“吞噬世界”的服务器的力量。
但摩尔定律就是摩尔定律,近年来人工智能硬件和软件都有了巨大的改进。如今,有了一种新的神经网络,它可以完全运行在廉价、低功耗的微处理器上,它可以完成我们需要的所有人工智能技巧,但永远不会将图片或声音发送到云端,它就是边缘AI。在接下来的一段时间里,如果我们足够幸运的话,我相信它可以给我们带来方便,而且不会损害我们的隐私。
一家边缘AI公司——Picovoice,它生产的软件可以识别语音命令,但你能想象,它只是运行在一个价格不超过几美元的小微处理器上吗?硬件是如此便宜,以至于智能语音技术可能会被应用于洗衣机或洗碗机等日常家居中。Picovoice表示,它已经在与各大家电公司合作开发语音控制设备。
这么小的AI是怎么运行的?
这其实是一个巧妙的工程技术。传统的神经网络多使用长数位数的数字进行计算,而Picovoice使用的是非常短的数字,甚至二进制的1和0,这就使得AI可以在速度慢得多的芯片上运行。这种折中方案塑造出来的似乎是一个不那么雄心勃勃的机器人:一个咖啡机的语音识别人工智能只需要识别大约200个单词,所有这些都与java的酿造任务有关。
“你不能像使用Alexa那样跟它对话或者开玩笑,但谁在乎?它只是一个咖啡壶而已。”
Picovoice创始人Alireza Kenarsari-Anhari说,你不会与咖啡机进行有意义的对话。
这是一个很有哲理意义的观点,它暗示了当今人工智能的另一个问题:公司不断创造语音助手,试图让他们表现得像C-3PO(《星球大战》中的机器人),它几乎能听懂你说的任何话。这很难,而且确实需要大量的云来实现。但是日常用品不需要通过图灵测试。我不需要一个会讲“爸爸笑话”的电灯开关或让它有什么自我意识。它们只需要听懂“开”和“关”或者“暗”就行了。
当涉及到和我“同床共寝”的小玩意时,我宁愿它们不那么聪明。
更重要的一点是,边缘AI反应很快。从设备发送你的声音请求,到在整个非洲大陆的中途播放Smash Mouth的“全明星”,再到亚马逊的服务器,NSA大量思想犯罪数据或任何最终结果的过程中,性能不会暂停,也不会损失几毫秒。
“边缘处理风驰电掣”,Todd Mozer说,他是sensor公司的首席执行官,这家公司为边缘设备制造视听识别软件。他演示了他为微波炉创建的一些神经网络代码,他发出的任何命令,比如“把我的爆米花加热2分36秒”,都能立即被识别出来。
这也使边缘AI更加节能。无需云计算可以减少为互联网数据包路由提供动力所需的碳燃烧量。确实,西雅图公司XNOR.ai公司苹果公司最近收购了一款图像识别神经网络,它的重量非常轻,可以由一个小型太阳能电池供电。(真正意义上的油炸面条,是用植物产生的微弱电压来制作的)。正如XNOR.ai联合创始人阿里·法哈迪(Ali Farhadi)指出的那样,边缘AI不仅环保,还能保护隐私:“我不想有一个能把我孩子卧室的照片发送到云端的设备,不管它宣称有多安全,他们似乎每隔一天就被黑客攻击一次。”
当然,传统的AI并不会消失,一些机器智能方面的创新可能需要云功能。毕竟,有些人可能真的想跟牙刷聊天,所以他们当然可以把自己的口腔清洁数据反馈给“索伦之眼”(《指环王》剧情),这也许很有趣。但对普通人来说,相信大多会选择边缘AI:少点智慧,多点隐私。
13520832007