5月28日早上,程序员李旭(化名)到自己的公司后,发现前一天发的一条微博在网上炸了。评论区里,骂声扑面而来:“以荡妇羞辱为本质”、“对他人隐私的完完全全地侵犯”、“违法而满足一己私欲的炫技”……
半年时间,100多TB数据,利用海外一些主要色情网站采集的数据比对微博等社交媒体,李旭在名为“将记忆深埋“的微博里写,他们“在全球范围内成功识别了10多万从事不可描述行业的小姐姐”。
简单说,他和他的团队利用图像比对的原理开发了一套AI系统,用来识别社交媒体上“滥交的女性”。2018年8月13日,他首次在网络上发布了关于这个项目的构想——
“鉴于很多人都在说程序员是各种退休小姐姐的接盘侠,我联合了几个小伙伴准备把各种色情网站上的视频和图片打tags后去做匹配,为码农朋友们做一个初步过滤。”
专栏作家侯虹斌告诉《极昼》,女性选程序员作为’接盘侠’,“完全是他们一种非常荒诞的想象”。相反,她提到美国警方曾在一两年前公布过一项数据,某次“钓鱼执法”抓到的上百名男性嫖客里,中文姓名的超过1/10,身份是在当地工作的程序员。她认为,李旭从头到尾都是要为男性谋福利,“带有极其男权的视角,猎奇、猥琐的那种”。
侯虹斌认为,视频中的人不管是不是性工作者,一定有被偷拍的、被迫的。本来这些视频只有很少一部分人才会看到,但经过他们传播,色情网站的浏览量一定会暴增,对受害女性会二次伤害,除非这个系统完全没有影响力。
“我一直在尝试解释,但已经没有人愿意听了。”李旭接连发布多条微博,说明查询需要通过实名认证和人脸识别,仅供本人检测是否在网络上被传播过不雅视频和图片;项目并非为了盈利,而是想帮助“真正需要帮助的人”。他原本计划“在解决法律问题后公开发布(这个查询系统)”。
数轮辩论后,他关闭了评论功能。5月31日,他取消了前一日宣布的开通直播间接受所有媒体采访的计划,只留下邮箱地址,用以回应公众的质疑。随后,他删除了项目的所有数据。
《极昼》通过邮件联系了李旭。他逐一回复了问题,答案总是简短、概括。李旭在德国创业,有自己的科技公司。微博简介里,他给自己加上几个标签:异性恋,C/C++,Lisp,Julia Developer,Startup,非著名黑客,人工智能砖家,aka(Also Known As)真伪书生。
"我们筛选出了不到11万女性,拥有微博或抖音帐号的不到1000人"
极昼:你做这个项目的灵感和初衷是什么?
李旭:最初是为了寻找那些滥交的女性。但在项目真正启动后,我觉得女性可以用它来查询色情网站上是否有自己被迷奸、诱奸的视频或图片,并且它可以让她们尝试发送“DMCA删除请求”给色情网站,这样可能会更有意义。
(编者注:DMCA全称为“Digital Millennium Copyright Act”,即美国的《数字千年版权法案》,是保护网络作品著作权的法律依据。)
极昼:你怎么定义“滥交的女性”?身边有吗?
李旭:就是网上一些炫耀自己睡了多少男人、喜欢群交的女性。父母曾经教育过我要远离那些“乱七八糟的女性”。我身边没有。
极昼:为什么要寻找她们呢?
李旭:我有一个朋友,十多年前上大学的时候认识的,他被这种人伤害过。去年,他染上了HIV,问我借钱治病。他谈起这件事的时候很懊悔,也带着绝望。患病对他的影响很大,原本挺开朗的一个人,变得沉默寡言。现在他身体还好,仍然在治疗中。
极昼:女方是性工作者吗?
李旭:我不好给别人乱贴标签,不知道是不是职业性工作者。但我在色情网站上发现了那个女孩和一些黑人的性爱视频。
她并不知道自己被感染(HIV),不是恶意隐瞒。得知我朋友患病之后,她也很绝望。
极昼:项目真正启动后,想法为什么发生了转变?
李旭:我们在抓取数据后发现,在欧美色情网站上,有很多中国女性被偷拍的性爱视频,而且在一些社交平台上,还有人用视频和图片炫耀自己和多少个中国女性做过爱。
后来我们在全球筛选出了不到11万女性,其中拥有微博或抖音帐号的,只有不到1000人。这个数字在我意料之外,却也在情理之中,因为我们并没有采集到太多的国内社交媒体的数据。
极昼:为什么只做女版,不做男版?
李旭:因为采集数据的时候,并没有采集男性社交媒体数据来进行大规模训练,仓促做男版误报率可能会非常高。而且我现在工作很忙,没有太多精力来做。
“做项目时没有考虑那么多”
极昼:你在微博上说“联合了几个小伙伴”,能介绍一下你的团队吗?
李旭:一共有七个人,来自不同国家,其中有一个女性。他们都是我打电话邀请的,其中两个人有过犹豫,担心程序做出来后被滥用,最终大家在线下见面,一起讨论了整个项目的社会意义,以及如何保证数据不被滥用,才确定下来。
极昼:能形容一下他们都是什么样的人吗?
李旭:可以说是Geek(极客),也可以说是Old School Hacker(老派黑客)。
极昼:中途有人退出吗?
李:没有。
极昼:你们是否考虑过合法性问题?从什么时候开始的?
李旭:做项目的时候并没有考虑那么多,两个月前开始考虑。我说过很多次,在做好完整的隐私条款、解决法律问题之前,这套查询系统是不会发布的。
极昼:系统的数据来源是什么?是否会有侵犯隐私权的风险?
李旭:目前的数据来源于互联网的公开数据。至于采集社交媒体数据,那是没办法的事儿,因为前期需要数据做支撑,进行规模训练。商业化的情况下,可能会存在部分侵犯隐私权(的风险)。
(编者注:西安交通大学苏州信息安全法律研究中心主任马民虎告诉《极昼》,根据我国的《网络安全法》,未经本人同意在社交网络收集个人信息是一种非法行为。如果有中国用户使用这个系统,开发者就会面临违反《网络安全法》的风险。
中国人民大学法学院教授张新宝补充,鉴于开发行为在德国发生,开发者会触犯到欧盟去年5月25日出台的《通用数据保护条例》。这一条例曾被评价为“史上最严个人数据保护条例”。)
极昼:性爱视频网站上有大量的偷拍,如何甄别摆拍与偷拍?
李旭:通过摄像机的角度和位置来区分。
极昼:如何甄别性交易与伴侣之间的性爱视频?
李旭:无法甄别。
极昼:这样可能会影响到不是性工作者的女性?
李旭:这个查询系统需要通过eID(公民网络电子身份标识)实名认证后注册登录,不经过本人同意是无法查询的。增加人脸识别作为二次确认后,只能查询自己是否有视频或图片被上传到色情网站。我不认为这样会影响到别的女性。
极昼:通过eID系统来保障隐私权,在技术上如何实现?
李旭:欧盟1999年开始推行eID ,目前在很多国家已经完全普及。eID服务是可以随便申请接入的,在中国也一样。
(编者注:马民虎教授解释,eID与二代身份证网络认证不同,后者的应用受到《中华人民共和国居民身份证法》的保护,而前者在我国的普及度并不高,国家也没有在法律层面推行。
中国公民网络身份识别系统的官网显示,“凡是认可《eID个人信息保护政策》,致力于保护个人信息的线上应用,均可申请接入eID服务”。申请者需与专门的服务机构签订合作协议,并通过eID签发中心的审核。马民虎认为,这个系统有非法收集个人信息的风险,签发中心不会通过其接入eID服务的审核。)
(图片来自中国公民网络身份识别系统官网)
极昼:有人提出,这个系统可能会被一部分人用来寻找“滥交的女性”,从而变成约炮工具,你有考虑过这个问题吗?
李旭:不存在这个可能,答案同上。我也多次在删除的微博里提到过。
极昼:有人说这个项目的本质是“荡妇羞辱”,你怎么看?
李旭:完全不是,这是典型的污蔑。在2018年8月公布要做这个项目的时候,我就已经考虑了隐私问题。
(编者注:李旭向《极昼》提供的一张截图显示,2018年8月13日,他在微博上就提出通过eID实名认证的想法。原文与现在的说法有部分差别:“为了避免滥用和相应法律风险,如果需要获得源数据,我们会通过eID进行实名认证后获取。”
2019年5月28日,引起舆论关注后,李旭发布了这样一条微博:“鉴于很多(人)说到偷拍视频存在的问题……在合法的产品对外发布时,我会单独把偷拍数据比对放在另外一个数据库。仅供本人通过eID实名登录并人脸识别认证才能查询……”)
(李旭微博截图,受访者供图)
“是的,我做错了,不应该仓促发布”
极昼:你在什么时候发现这个项目在网络上引起了很大风波?
李旭:发布项目成功那条微博的第二天,我到公司后在微博上看到的。一个帐号(对我的微博)选择性截图,并配了一份聊天记录——不知道是微信还是QQ里面,有人自称开发了“原谅宝”程序,要发起众筹。
网上流传的那个“原谅宝”,我并不知情。目前为止,我这套系统还没有命名,不可能是“原谅宝”。
我发现后给那个账号发了消息,让他道歉并澄清此事。但事实上已经没多大作用了,他的微博被转载到各种论坛和群里,铺天盖地的漫骂出现。我一直在尝试解释,但已经没有人愿意听了,随后我关闭了微博的评论。
极昼:之前有预料到会遭受到这么多的反对和攻击吗?
李旭:没有预料到。我还认为只可能有来自非法色情产业的攻击。
整个项目过程中都没有遇到过类似的反对和攻击。如果有的话,我不会想再受到第二次这样的攻击。
极昼:你最不能接受的攻击是哪种?
李旭:无脑谩骂。
极昼:团队其他人什么时候知道的?
李旭:5月29日。他们说我太冒失,不应该那么冲动地公布这个消息。
极昼:有人说,如果把这个项目写进简历里,再也没有人会录用你了。你怎么看?
李旭:我这辈子都不会写简历了,打工是不可能的。
极昼:5月31日,你删除了项目的所有数据,为什么?
李旭:承受不了舆论压力。如果是因为法律风险,我最多不发布产品。
极昼:你家人的态度是什么?
李旭:我的未婚妻很支持,她知道这个项目后,主动减少让我陪她购物的时间,以便我能尽早完成。她也知道我花钱采购设备,并没有说我什么。这几天,她的态度还是和从前一样,没有变化。
极昼:这个项目一共花了多少钱?
李旭:超过20万欧元,完全是我个人出资的。
极昼:这不是一笔小数目。
李旭:这笔钱对我而言并不多,业余时间我在金融市场大概一个月能赚回来。我做这个项目不是奔着赚钱去的。
极昼:那是完全没有考虑盈利吗?
李旭:考虑了盈利,但所有的盈利,除去服务器升级、带宽费用、电费等保障基础运营的费用,剩余的将全部捐赠给预防艾滋病的公益机构。这也是为什么团队成员都没有拿一分钱,做这份业余工作的最主要原因。
事实上,如果(5月31日)能正常直播的话,产生的所有收益也是直接捐赠给中国预防性病艾滋病基金会,用于救助受艾滋病影响的儿童。这个信息你们可以和平台确认。
极昼:你还把微博头像改成了鞠躬的小人,旁边写着“对不起”,是觉得自己做错了吗?
李旭:是的,做错了。我不应该仓促发布,应该做好完整的计划,表明我们事实上是要做什么,并尽可能争取得到相应部门的支持。
极昼:那句“对不起”是对谁说的?
李旭:对我们的开发人员说的,也是对所有被误解的人说的。
(应受访对象要求,李旭为化名)