隔屏有耳调查：亚马逊智能音箱有千人监听团队，曾听到性侵案_团队训练_教练

小编

04-12

0次

原标题：隔屏有耳调查｜亚马逊智能音箱有千人监听团队，曾听到性侵案

　　遭遇“隔屏有耳”质疑的，不止中国流行的手机App，还有国内外近年兴起的智能音箱。最新的一例是亚马逊智能音箱Echo植入的智能语音助手Alexa，被曝有人类人工参与“监听”。

　　4月11日，彭博社发布调查报道，揭秘了亚马逊Alexa“监听”团队中，这些一直被隐藏的人类员工的工作内容。报道称，有时候，参与其中的工作人员会听到用户私人的声音片段，如一个女人洗澡时严重走调的歌声，或者一个孩子尖叫着寻求帮助。还有两名员工甚至称，他们听到过他们认为是性侵案的声音。

　　亚马逊此前从未公开过它会人工听取用户和Alexa的私人聊天，也没有披露过Alexa的语音技术中，部分包括人类参与。7位为该项目工作的员工向彭博社透露了亚马逊Alexa的这项人工声音检查流程。

　　亚马逊的Echo是世界上最流行的智能音箱，它于2014年上市；Echo音箱之后，谷歌也推出了植入谷歌语音助手的Google Home智能音箱，苹果随后推出了采用Siri的智能音箱HomePod。在中国，天猫精灵、小度智能音箱、小米AI音箱等设备也纷纷走进了更多用户家庭。

　　如今，很多用户已经习惯于通过唤醒词将音箱中的语音助手激活，进而向它提出问题或下达指令，有的智能音箱甚至还能与用户简单地聊两句天。但彭博社的报道提出，智能助手如此“懂你”的背后，可能并不仅仅是人工智能和机器学习，而是有人类员工团队人工听取用户与设备的对话录音，并帮忙改进算法的结果。

隔屏有耳调查：亚马逊智能音箱有千人监听团队，曾听到性侵案

　　Google Home智能音箱

　　亚马逊千人监听团队

　　彭博社报道介绍，亚马逊在全球有数千名工作人员，他们人工听取和检查用户和智能语音助手Alexa的私人对话，目的是帮助Alexa改进语音识别技术。

隔屏有耳调查：亚马逊智能音箱有千人监听团队，曾听到性侵案

　　Echo音箱

　　该团队专门收听用户在家中和办公室里被Echo音箱抓取的录音。这些录音会被转录、加上注释，然后反馈到软件中，以消除Alexa对理解人类语言的差距，帮助它更好地响应指令。

　　亚马逊在广告词中介绍，“Alexa生活在云端，并且一直越来越聪明”，实际上，和许多需要从经验中学习的软件工具一样，人类也为机器做了不少教学。

　　执行这一工作的团队包括全职亚马逊员工和合约工，工作地点遍布世界不同地区，包括波士顿、哥斯达黎加、印度、罗马尼亚。员工签署了保密协议禁止公开谈论这一项目。

　　罗马尼亚首都布加勒斯特的两位员工透露，他们一天工作9小时，每班解析多达1000条音频片段。

　　波士顿的一名员工则表示，他为特定的话语，如Taylor Swift，挖掘了累积的语音数据，并对其进行了注释，以表明这个搜索是指那位歌手。

　　私人声音片段也会被抓取

　　智能音箱需要时刻开启麦克风，以监听用户是否说出了唤醒词、是否在向自己下命令。亚马逊语音助手Alexa的软件就被设计为持续记录音频片段，聆听唤醒词。默认的唤醒词即为“Alexa”。

　　目前的工作流程下，私人的声音片段也会被设备抓取。

　　有时候，工作人员会听到用户私人的声音片段，如一个女人洗澡时严重走调的歌声，或者一个孩子尖叫着寻求帮助。工作人员利用内部聊天室共享文件，解析含糊的单词，或者是分享搞笑的录音。

　　有时员工还会听到不安甚至有可能是犯罪的录音。两名员工称，他们听到过他们认为是性侵案的声音，当这种事情发生时，他们会在内部聊天室说出来解压。

　　亚马逊对此表示，员工听到令人痛苦的事情时，他们有标准流程处理。但是这两位罗马尼亚员工表示，他们要求对这类案件进行处理时，被公司告知干预此类事件不是亚马逊的工作。

　　“我们认真对待用户的个人信息和隐私安全。”亚马逊发言人在一份电子邮件声明中称，“我们只会注释极小一部分的Alexa录音样本，为了改善用户体验。如帮助我们训练语音识别和自然语言理解系统的信息，这样Alexa可以更好地理解用户要求，并保证对每个人都能提供好的服务。”

　　“我们有严格的技术和操作保障，对滥用我们系统的行为采取零容忍政策。员工在工作流程中无法直接访问能辨别用户和账号的信息。我们使用多重验证来限制访问，对服务加密，审计我们的工作环境，以对所有信息高度保密。”

　　语焉不详的隐私政策

　　亚马逊在其宣传和隐私政策的材料中，没有明确表明Alexa获取的一些对话录音是人工来听，只是在常见问题解答列表中提到了一句“我们使用您对Alexa的命令来训练我们的语音识别和自然语言理解系统”。

　　Alexa的隐私设置中，公司给用户提供了禁用录音开发新功能的选项。彭博社看到的截图显示，发送给工作人员的Alexa录音没有提供用户的全名和地址，但与用户的账户号、名称和设备序列号相关联。

　　依赖人类员工填补算法空白的，还有谷歌、Siri

　　亚马逊圆柱形的智能音箱Echo于2014年上市后，很快就因其可以在家中使用智能语音软件快速流行开来。不久之后，谷歌母公司Alphabet推出了自己的版本Google Home，随后是苹果公司的HomePod，在中国也有很多品牌的智能音箱产品。

　　据研究机构Canalys的报告，2018年，全球消费者购买了7800万台智能音箱，其中数百万台通过语音软件与智能手机上的智能助手进行交互。

　　大多数现代语音识别系统依赖于模仿人脑的神经网络，软件会通过海量数据进行机器学习，为Echo等其他智能音箱的算法提供可能性的模型。如果用户问Alexa附近有没有名叫“希腊某某”的地方，算法会自动知道用户在寻找希腊餐厅，而不是教堂或社区中心。

　　但Alexa也经常犯错，尤其是俚语、口语、方言和非英语的语言。因此亚马逊需要雇佣人类员工，帮助填补算法的空白。

　　除了亚马逊之外，实际上，其他品牌的语音助手也都是在人类的帮助下训练出来的。

　　苹果的Siri也有人类员工的帮助，他们负责评估语音助手对请求的解释是否与用户说的相符。根据苹果安全白皮书，员工检查的Siri录音是没有个人身份信息的，录音会与一个随机标识符关联，存储六个月，之后这些数据就会被移除随机标识符，但它们也有可能存储更长时间以改善Siri的语音识别。

　　在谷歌，一些人类员工也可以获取谷歌助手的音频片段帮助训练和改善产品，这些音频也没有个人身份信息，并且经过音频失真处理。