有多少面部识别系统偷偷用过你的照片?是时候用这个工具检查一下了
新智元报道
来源:外国媒体
编辑:keyu
在【新智元导读】,这个数据泛滥的时代,有多少组织以一种奇特的方式使用过你的私人数据?国外研究人员开发了一种叫做曝光的工具。AI,可以帮助人们了解自己的人脸数据是如何被各种人脸识别系统使用的,往往会得到意想不到的结果。
当科技公司开发出一种“侵犯个人隐私”的面部识别系统时,他们得到了你意想不到的帮助:你的脸——
公司、大学和政府实验室使用了从各种在线资源中收集的数百万幅图像来开发这项技术。
现在,国外研究人员开发了一种技术:“曝光。AI”,可以帮助人们在这些图片中搜索自己的老照片。
这个工具可以匹配Flickr在线照片分享服务中的图像,并提供一个窗口,用于查找各种AI技术(从面部识别到聊天机器人)使用的大量数据。
“人们需要知道他们最私密的照片可能会被使用,”隐私和民权组织监控技术监督项目的技术总监莉兹奥沙利文(Liz O'sullivan)说。
她与柏林的研究员和艺术家亚当哈维合作,并参加了《揭露》。AI项目。
蜜月照片被国家监控系统使用,导演感到“害怕”。
人工智能系统不会变得神奇地聪明。——他们通过精确定位人类产生的数据模式向我学习。技术一直在进步和发展,然而,他们已经学会了人类对妇女和少数民族的偏见。
你可能不知道,自己其实一直在默默为AI的发展做着贡献.
对于有些人来说,这是一件很新奇的事情,而对于另一些人来说,则很毛骨悚然。
关键是在国外,这可能是违法的——
2008年,伊利诺伊州通过了一项名为《生物特征信息隐私法》(生物信息隐私法案)的法律,要求未经同意使用面部扫描的人将受到经济处罚。
2006年,来自不列颠哥伦比亚省维多利亚市的纪录片导演布雷特盖勒(Brett Gaylor)将他的蜜月照片上传到当时流行的Flickr网站:
15年后,使用早期版本的曝光。哈维提供的AI,他发现自己蜜月旅行的数百张照片已经进入了多个数据集——,很有可能被用来训练全世界的面部识别系统。
Flickr已经被很多公司买卖了很多年,现在属于SmugMug,一家图片分享服务公司,允许用户在Creative Commons许可下分享自己的照片。
/13126753292/1000">这种许可在互联网网站上很常见,意味着其他人可以在一定的限制下使用这些照片(尽管这些限制可能被忽略了)。
2014年,当时拥有Flickr的雅虎(Yahoo)在一个数据集中,为了帮助计算机视觉方面的工作,使用了许多这样的照片。
盖勒好奇,自己的照片究竟是如何被到处传来传去的。接着,他就被告知,这些照片可能被美国和其他国家的监控系统所使用。
「我的好奇变成了恐惧」,他说。
是的,一个美国人的蜜月照片,竟然被用来建立国家级别的监视系统,实在是令人意外。
非商业用途MegaFace被各种公司普遍使用,下线也无法解决问题
几年前,顶尖大学和科技公司的人工智能研究人员,开始从各种渠道收集照片,这些渠道包括照片分享服务、社交网络、OkCupid等约会网站,甚至还包含安装在大学里的相机。收集之后,他们向其他组织分享了这些照片。
这对于研究人员来说,是正常现象。他们都需要把数据输入新的人工智能系统,所以他们就分享了所有的数据,但这是合法的。
MegaFace数据集就是一个例子——这是华盛顿大学的教授们在2015年创建的一个数据集。
他们在数据源没有知情且同意的情况下,就把他们的照片放进了庞大的照片库中。
这些教授将图片发布到互联网上,以便其他人可以下载。
根据《纽约时报》的公开记录请求,世界各地的公司和政府机构已经下载了超过6000次MegaFace。其中包括美国国防承包商诺斯罗普·格鲁曼公司、中央情报局的投资部门In-Q-Tel,当然还有中国的社交媒体及公司等。
研究人员创建MegaFace的起初目的,是为了将其用于一项旨在促进面部识别系统发展的学术竞赛,是不是为商业用途准备的。
然而事实是,但只有一小部分公开下载了MegaFace的用户参加了这场比赛。
「我们不适合讨论第三方项目」,华盛顿大学发言人维克托·巴尔塔(Victor Balta)说,「MegaFace已经“退役”,我们也不再分发MegaFace的数据了」
今年5月,华盛顿大学(University of Washington)将MegaFace下线。然而。这些数据的副本可能出现在任何地方,并继续为新的研究提供素材。
限制之下,隐私数据滥用问题何时可解?
奥沙利文和哈维花了数年时间,试图开发一个可以揭露所有这些数据使用情况的工具,实际的过程比他们预料的要困难。
他们想要使用某人的照片,来立即告诉那个人ta的脸被包含在各种数据集的次数。
但他们担心,这种工具可能会被其他组织用在不好的地方。
「潜在的危害似乎很大」,奥沙利文说。
值得一提的是,奥沙利文还是帮助企业管理AI技术使用的纽约公司Responsible.AI的副总裁。
最后,他们被迫限制了人们搜索该工具的方式以及搜索提供的结果。结果是,这个工具并不像他们希望的那样有效。
Exposing.AI本身并不使用面部识别技术。只有当你提供了可以在线指向该照片的方式——比如一个互联网地址,它才能实现照片的精确定位。
此外,人们只能搜索发布在Flickr上的照片:他们需要Flickr的用户名、标签或网络地址来识别这些照片。
研究人员表示,这一举措是为了加强安全和隐私保护能力。
虽然限制了该工具的用途,但它的效果仍然让人大开眼界:
Flickr上的图片构成了大量的面部识别数据集,这些数据集已经在互联网上广泛流传,其中就包括MegaFace。
使用Exposing.AI 找到与自己有联系的照片并不难:只需要在旧邮件中搜索Flickr链接,就能找到被用于MegaFace和其他面部识别数据集的照片。
通过这个工具,盖勒对他所发现的情况感到特别不安,因为他曾经认为。互联网上的信息自由流动是一件积极的事情,而他使用Flickr,是因为其他人使用他照片的权利是受到知识共享许可限制的。
「我现在正经历着这些后果」,他说。
他的希望——也是奥沙利文女士和哈维先生的希望——是公司和政府会制定新的规范、政策和法律,来防止个人数据被大量收集。
此外,盖勒正在制作一部记载他的蜜月照片漫长、曲折、令人不安的「流传历程」的纪录片,来揭示这个私人数据被滥用的问题。
参考链接:
https://www.nytimes.com/2021/01/31/technology/facial-recognition-photo-tool.html?referringSource=articleShare
