为什么23andMe的基因数据可能成为AI公司的“金矿”
源新闻来源:TIME
语言:英文,所在国:美国
分类:AI与医疗健康
基因检测公司23andMe在周日晚上宣布破产,结束了多年的财务困境。这意味着所有极其私人的用户数据都可能被出售——而这一庞大的基因数据宝库可能会吸引那些希望训练数据集的AI公司的兴趣。
“数据是新的石油——而这是一种非常高质量的石油,”天普大学福克斯商学院教授Subodha Kumar表示。“随着越来越复杂和严格的算法的发展,这对许多公司来说是一个金矿。”
然而,任何试图收购23andMe的AI相关公司都将面临巨大的声誉风险。许多人对于他们为了追溯祖先而提交的基因数据现在可能以他们从未同意的方式被使用感到震惊。
“任何人接触这些数据都会承担风险,”Kumar说,他是福克斯商学院商业分析和颠覆性技术中心的主任。“但同时,不接触这些数据,他们也可能失去一些重要的东西。”
更多阅读:《23andMe申请破产。这对您的账户意味着什么?》
训练LLM
像OpenAI和谷歌这样的公司已经投入了大量时间和资源来影响医疗领域,23andMe的数据宝库可能会吸引财力雄厚的大型AI公司的兴趣。本周23andMe的估值约为4800万美元,比2021年的峰值60亿美元大幅下降。
这些公司正在努力构建最强大的通用模型,这些模型是在大量的细粒度数据上进行训练的。但研究人员指出,高质量的数据来源正在枯竭,这使得新的、稳健的信息来源更加珍贵。今年早些时候TechCrunch对风险投资家的一项调查显示,超过一半的受访者认为“数据的质量或稀有性”是AI初创公司相对于竞争对手的优势。
“我认为23andMe的数据集对一些大型AI公司来说可能非常有价值,因为它代表了实际基因数据的真实数据,”Open Data Labs首席执行官Anna Kazlauskas谈到23andMe时表示。“一些生物出版物中可能存在的人为错误可以避免。”
Kumar表示,23andMe的数据在推动自主AI(即无需人类干预即可执行任务的AI)方面尤其有价值,无论是在医学研究还是公司决策中。
“自主AI模型的整个目标一直是模块化方法:你解决小问题,然后将它们组合在一起,”他说。
谷歌和OpenAI的代表没有立即回应置评请求。
行业价值
23andMe的数据在不同行业中也有价值,这些行业使用AI来处理大量数据,首先是医学研究。
23andMe已经与葛兰素史克等制药公司达成了协议,这些公司利用该公司的数据集希望能开发出新的疾病治疗方法。Kumar表示,在天普大学,他和他的同事们正在开展一个项目,为卵巢癌患者创建个性化治疗方案,并发现基因数据在理解以前无法理解的结构方面“非常、非常强大”。
然而,Insilico Medicine创始人兼首席执行官Alex Zhavoronkov认为,23andMe的数据可能并不像人们想象的那样有价值,尤其是在药物发现方面。“大多数低垂的果实已经被摘取了,而且在主要学术论文中已经发表了大量公开数据,”他在给《时代》杂志的一封电子邮件中写道。
但其他许多行业的公司也可能会感兴趣。这是一个异常庞大且细致的数据集:如此大量的基因数据,尤其是附带个人健康和医疗记录的数据,很少公开可获取,Anna Kazlauskas说。“所有这些背景数据使其非常有价值——而且很难获得。”
潜在感兴趣的行业包括保险公司,他们可以利用这些数据识别具有更高健康风险的人,从而提高保费。金融机构可以通过跟踪基因标记和消费模式之间的关系来评估贷款。电子商务公司可以利用这些数据向特定医疗条件的人群投放广告。
伦理和隐私问题
但公司也面临着参与其中的重大声誉风险。2023年,23andMe遭受了一次黑客攻击,暴露了数百万用户的个人数据,严重损害了公司的声誉。来自其他行业的竞标者可能比23andMe更缺乏数据保护,Kumar说。“我担心的是,有些公司不习惯拥有这种类型的数据,他们可能没有足够的治理措施,”他说。
这尤其危险,因为基因信息本质上是敏感的,一旦泄露就无法更改。自愿提供数据的人的家庭成员的基因信息也处于风险之中。鉴于AI众所周知的偏见,这种数据的滥用可能导致在招聘、保险和贷款等领域出现歧视。周五,加州总检察长罗伯·邦塔发布了一份针对23andMe客户的“紧急”警报,建议他们要求公司根据加州隐私法删除他们的数据并销毁他们的基因样本。
电子前沿基金会网络安全总监Eva Galperin担心23andMe的基因数据可能在市场上永久处于不稳定状态。“一旦你出售了数据,就没有限制它可以被转售多少次,”她说。这可能导致基因数据落入那些可能不重视伦理考虑或没有强有力的数据保护措施的组织手中。
Insilico Medicine的Zhavoronkov表示,所有这些担忧意味着潜在的AI相关竞标者将被劝阻不要尝试购买23andMe及其数据。“他们的数据集实际上是毒药,”他说。“谁购买并训练它,谁就会受到负面宣传,收购方可能会受到调查或起诉。”
无论最终发生什么,Kazlauskas至少对这个困境引发的关于数据主权的更大讨论表示感谢。“我们未来应该希望避免这种情况,即你决定做一次基因测试,五年后这家公司陷入财务困境,你的基因数据就有被卖给最高出价者的风险,”她说。“在这个AI时代,这些数据非常有价值。”
(全文结束)
声明:本文仅代表作者观点,不代表本站立场,全文内容涉及AI跨语种自动翻译。如有侵权请联系我们删除。