近日撰文介绍了谷歌的“基准线项目”(PROJECT:BASELINE),这是一个新的健康研究项目,将收集1万个参与者的详尽健康数据。这个项目可能为公众带来巨大的好处,但是它也提出了隐私上的挑战。以下为原文内容:
确切地说,“基准线项目”是由VERILY推出的,但VERILY也就是之前的谷歌生命科学部门,现在划归到谷歌母公司ALPHABET旗下,所以你也可以说它是谷歌的项目。
你要申请参加这个项目吗?那你需要佩戴专门的新式手表,监测你的心率,还要把传感器放在你的床垫下,可以分辨出你什么时候是在睡觉。你要在手机上回答所有问题,每年到谷歌的一个合作点(它和杜克大学、斯坦福大学、洛杉矶一个私人诊所合作设立了三个合作点)那里进行血液检测、成像检测,以及基因组扫描等等。
你可能觉得谷歌反正已经知道了关于我们的一切了——从电邮、照片到通讯录,以及你在互联网上的所有足迹(即使偶尔你使用的是BING,谷歌也会知道)。所以就算你的心率也被谷歌知道了,那又会怎么样呢?
但是,在涉及人类的大型科学研究上,你必须要问一些问题:谁会受益?是你吗?还是其他人?还是收集数据的人?
对大量人群进行的健康研究已经取得了医学上的巨大成功。1948年,在马萨诸塞州弗雷明汉镇开启的弗雷明汉心脏研究项目涵盖5209人,并扩大到了他们的子女和孙辈,研究者每两年对他们进行一次体检,来确定吸烟、高血压和运动不足造成心肺问题。1976年开始的护理健康项目研究的是饮食和身体活动对健康的影响,涵盖人数超过25万。
这样研究理应对收集到的数据进行匿名化处理、取消识别标志,同时保留那些有用的信息,比如血糖水平、体重、心率等等,但你的姓名和地址不会留在里面。这个做法在1948年或1976年更容易实现。而在今天的一些项目迭代中,比如使用生物库中的组织样本数据,或者冰岛对每个公民进行基因序列化,要真正做到匿名非常困难。因为像选民登记、人口普查,以及个人健康信息等大型数据库之间的重叠,意味着一个优秀的编程人员通常可以对这些内容进行“去匿名化”处理。这对数据库涵盖的人来说可能很不利,但是对于想要从中获利的人来说,这倒是个好消息。
要注册“基准线项目”,你要签署同意书,表示同意使用你的匿名数据进行研究。也许最终它们会被出售给客户、商业和学术组织。你需要通过谷歌帐户登录“基准线项目”。 VERILY的首席医疗官杰西卡·麦嘉(JESSICA MEGA)说:“同意书本身就描述了正在收集的不同数据类型。重要的是,它确实区分了哪些信息将成为基准线研究的一部分,哪些信息将存在于你的谷歌帐户中。”也就是说,根据目前的协议,“基准线项目”的研究人员不会把你的基因组与你的谷歌邮件进行同步。
可能你觉得自己本来也没有什么网络隐私,已经放弃抵抗了。“基准线项目”的常见问题页面上说,参与者可以看到自己的一些数据,比如实验室数据和调查问卷数据,也有机会看到一些整体结果。也许对于公共卫生来说,这么做是值得的。1万人放弃一点点隐私,给全世界带来莫大的好处。
谷歌已经与斯坦福大学和杜克大学的团队合作了三年,以了解该项目将测量哪些数据。“我们对人口的了解越多,我们可以为科学做得的贡献就越多,”麦嘉说。
首先获得数据的是斯坦福大学和杜克大学——然后再过两年,他们就会向其他合格的医学研究人员开放这些数据(他们将制定自己的道德伦理准则以及同意书)。斯坦福癌症研究员山姆·甘比尔(SAM GAMBHIR)参与设计了这个项目,他说,“这个研究不是由假设推动的。这是一个收集纵向数据集的研究。”如果一切按计划进行,该项目会获得很重要数据:血液、基因组、尿液、眼泪,以及通过可穿戴设备收集的心脏、睡眠,心智状态活动数据。甘比尔说:“以前没有人对1万人中每一个人进行如此深入的调查。”
这个项目的规模和深度解释了谷歌参与的原因。即使甘比尔自己有这个想法,又以某种方式获得了联邦的资助(有报道称,该项目需要1亿美元资金), “我们还是需要找到像VERILY或者ALPHABET那样的公司来合作——由于大数据结构的需要,以及参与者和互联网之间互动性的需要。” 他说。
谷歌仍然是一个营利性的商业实体。它需要获得一些东西来出售。“谷歌会开发出这个项目需要工具和技术,”麦嘉说。“我们需要创建新工具,比如VERILY STUDY WATCH,它里面有很多不同的传感器。我们正在创建平台,不仅可以传递来自传感器的数据,还可以从经典评估和分析评估中获取数据。”
尽管如此,谷歌的实力是在数据上。去年,谷歌的人工智能公司DEEPMIND与NATIONAL HEALTH SERVICE达成了一个共享数据的协议,为对方提供一个帮助治疗急性肾损伤的APP和人工智能能力。但这个协议在隐私细节上处理不当,谷歌没有获得数据共享的全权同意书,而且还不清楚该公司如何使用患者的数据。“就目前来说,只是获得先发优势,积累关于疾病的知识以及网络。”康奈尔科技研究员朱莉亚·博尔斯(JULIA POWLES)表示:“谷歌是世界上最强大的公司。他们有经济条件做这种事情,而且事情看起来与公众利益无法区分。”
在那之后呢?人口研究的最棘手的环节之一就是建立样本。即使有了1万人参加这个项目,你如何确保他们就能代表更广泛的世界?有可能男人太多,老人太多,如此等等,你得出的结果用处不大。例如这个项目的“液体活组织检查”等测试,要求受试者必须能够亲临帕洛阿尔托、达勒姆或洛杉矶。这就潜含着地理偏见。“可穿戴设备本身是否会改变个人的行为?有一些问题,将通过对这1万人进行分组来回答。”甘比尔说:“但是,总是有可能会存在一些偏差,有兴趣来参加这个项目的人本来可能就和其他人有所不同。”
谷歌正在小心地建立样本,以便能在产生统计上显著结果。根据定义,参加者终将是谷歌用户。但差不多所有人都已经是谷歌用户了。“你不需要成为他们研究项目的一部分,他们就已经知道很多关于你的东西了。”博尔斯说。“他们已经有了一半的数据了,10年来你在网上搜索的任何健康问题,他们都知道。”
那么你还想参加这个项目吗?当然你这样做你不仅仅会成为研究的对象,你也会是观众。如果你不介意戴上智能手表,睡在设备上,并传输自己的数据,那么你也可能是这个项目的获益者,获得改善健康状况的方法。你既是客户,也是产品。
友情链接