现在是大数据的时代,基因也可以大数据化吗??
今年初,人类全基因组测序成本已经降到1000美元以下,成本的降低将会带来应用范围和深度几何级数的上升,毫无疑问,尽管收费价格会随之下降,但市场的爆发与繁荣才是测序生产商和服务商真正渴望的。
2005年整个人类(据不完全统计)创造了150EB的数据,而在2010年,就达到了1200EB。现在华大基因一年的数据产生量就高达20PB。
一个个体有3G的基因组,还有超过一个PB的基因。为什么讲基因组学会是人类大数据的先锋?因为把每个人的单体拿出来,一个人就需要100GB的数据,中国有10亿人,全世界有70亿人,这是多么大的一个数据量。所以基因组测序必然是大数据的先锋。
ty_阿毛618 2021-09-27 22:30
完全可以~大数据这个词现在有点“泛滥”,甚至很多人错误地理解为数据大就是大数据,或者认为大数据是一个新鲜的事物,其实不然。人类肯定不是第一次遇到大数据的问题,只不过“大”的定义在不断的变化之中。尹烨在演讲中表示,生命科学会成为世界的主角,而整个生物组学的大数据已经达到10的60次方的数量级,而人类现在只完成了10的21次方,如果没有大数据,开发者_运维百科我们将寸步难行。
妹纸真俊 2021-09-27 22:33
基因作为一种信息的载体,其本身也是一种信息,当然可以大数据化了。近期有报道,Google X 实验室开始了 Baseline“基线”项目,大量收集人类基因组标本并利用大数据合成一份完美的健康人类基因图谱,为多种疾病的提早发现及治疗提供前提。
基线工程的第一步是采集175个参与者的匿名基因和分子信开发者_如何学C息,取样包括基因排序,血液,唾液,眼泪,尿液,以及参与者的食物及药物代谢信息,心率,家族病史等,第一波测量过后,参与者将佩戴可穿戴测量设备,持续提供体征信息。Google将通过第三方的隐私过滤得到匿名的基因组信息。下一步将把实验群体扩大到数千人,获得更多更广的基因数据。
Google创始人之一拉里佩奇(Larry Page) 多次提到大数据在健康和医药领域的巨大潜能,常常不忿隐私法律对于人体数据获取的制约,现在来看,Google可能在建立一个独立的庞大数据池,仅供自己所用,直接绕过隐私法获得数据,为其数据计算能力找到了新的用武之地。我们只能寄希望于斯坦福和杜克为大众把好隐私关,制约Google的数据用法和走向。
精彩评论