信息安全的伪命题:巨头科技公司正大光明地监听用户。
在智能音响研发中,参与者需要用海量音频内容对算法模型进行训练。然而在录音室中录制的音频难以满足鲁棒性要求较高的模型。也许是出于这个原因,亚马逊Alexa研发人员被要求使用Alexa设备上“窃听”用户与其对话的内容,存储音频,并将交给全球各地的标注人员,以助于特定话题下的对话体验。
Alexa语音系统涵盖Echo、EchoDot、EchoSpot等智能音箱产品。
据报道,亚马逊在全球雇佣数千名员工来改进Alexa语言系统,一份报告表示:“研究小组会监听Echo用户家中和办公室里的录音。”“这些录音会被转录、注释,然后反馈回软件,这是为了消除Alexa对人类语言理解的空白,帮助它更好地响应命令。”
知情人士说,这个团队由第三方承包商和一些全职亚马逊员工组成,他们在波士顿、哥斯达黎加、印度和罗马尼亚等地点办公,并签署保密协议,禁止公开谈论该项目。他们每天工作9个小时,每人每天需要要分析1000个音频片段。
该项目位于罗马尼亚首都的办公地点,没有任何外部标志显示亚马逊的存在。这项工作大多很简单。波士顿的一名工作人员说,他为“泰勒·斯威夫特”等特定话语挖掘了积累的语音数据,并对其进行了注释,以表明搜索者需要的是音乐艺术家泰勒相关内容。
有时他们听到令他们不安的录音,甚至是是犯罪现场的声音。两名工人说,他们认为发现了性侵现场的音频,类似的音频被处理时,他们有时会在“群里”分享,以缓解压力。亚马逊表示,当员工听到令人不快的事情时,他们有相应的程序可以遵循,但两名罗马尼亚员工表示,在要求对此类案件进行处理时,却被亚马逊告知无权干涉。
那么问题来了:监听部门员工若从Alexa听到小孩子呼救声、家庭暴力、犯罪等意外声响,会怎么想?他们会立即作出反应来报警么?还是根据亚马逊的要求坐视不管?
亚马逊一位发言人回复声明提到:“亚马逊严肃对待客户个人信息的安全隐私。为了改善客户体验,我们只注释了一小部分Alexa语音样本。这些信息会帮助我们训练语音识别和自然语言理解系统,因此Alexa才能更好地理解用户的请求。”
他们补充说:“我们有严格的技术和操作保障措施,对滥用我们的系统采取零容忍政策。员工不能直接访问作为此工作流一部分的个人或帐户标识信息。所有信息都被高度保密,我们使用多因素身份验证来限制访问、服务加密和审计我们的控制环境来保护它。”
这个剧情似乎曾经演绎过:中国微型芯片窃取数据的报道事件。亚马逊Alexa窃听“案件”,同样出自美国媒体“彭博社”之手,前者被曝光为虚假新闻。所以,以至于这则报告的真实性如何,我们还需等待进一步考证。
对此事件,亚马逊掌门人贝索斯尚未作出回应。