《邵恒头条》130期:大数据会导致“基因决定论”吗?

《邵恒头条》130期:大数据会导致“基因决定论”吗?

有声读物」「2019-11-22」「得到APP」 由罗辑思维团队出品,提倡碎片化学习方式,让用户短时间内获得有效的知识,旨在为用户提供“省时间的高效知识服务”。
你好,这里是《邵恒头条》,我是邵恒。 这周,我和得到上《法律思维课》的主理人刘晗老师、《全球创新260讲》的主理人王煜全老师,到哈佛大学参加了哈佛全球...

你好,这里是《邵恒头条》,我是邵恒。

这周,我和得到上《法律思维课》的主理人刘晗老师、《全球创新260讲》的主理人王煜全老师,到哈佛大学参加了哈佛全球教育与科技论坛。

在论坛上,我分享的话题,是如何让每个人都成为终身学习的践行者——换言之,怎么能撬动人们学习的兴趣和动力,让学习成为一个终身习惯。

你知道,每个人学习的驱动力都各不相同。英国哲学家培根曾经说过,学习或为乐趣,或为装饰,或为增长能力。就是说,有人学习,是因为满足好奇心而感到快乐;有人学习,是为了获取谈资,显示自己有学问;而有的人学习,是为了获得实际问题的解决方案。而反过来,我们可以说,有些人不乐意学习,原因也同样复杂,可能是学校的课不够有趣,也可能是因为家长从小给了太大压力,形成了反抗的心态,等等。

总之,决定一个人对教育态度的,是一个非常复杂的模型。而我注意到,现在有不少人都在尝试用大数据分析,更详细地拆解复杂行为背后的各个影响因素。比如说,在遗传学领域,科学家正在用基因数据,分析基因跟人类受教育程度的关联。

在今天的《邵恒头条》中,我给你介绍一下这方面的研究进展。

从高中生物课本里我们知道,基因决定了很多人体疾病和特征,如血型、红绿色盲、镰刀形 贫血等,这类由单基因决定的特征被称为“简单性状”。但这类简单性状在现实生活中其实只占人类各种特征的很小一部分。

而绝大多数人类特征,比如受教育程度、饮酒和吸烟倾向等,都是受到很多基因共同控制的“复杂性状”。与一个复杂行为特征相关的基因可以多达几十、几百,甚至更多,而每一个基因的贡献其实很微小。长久以来,科学家们一直试图破译,到底是哪些基因和我们的行为特征有关。

自然杂志网站11月发表的一篇文章显示,在最近十年的研究中,出现了一个引人注目的新趋势,科学家们开始越来越多地使用大数据分析的方法,寻找与受教育程度、家庭收入、幸福感等复杂性状相关的基因变异。

比如,科学家已经可以证明,一个群体受教育时间的长短,不仅仅和后天环境有关,和先天基因状况也有关系。

在英国的约克郡,有一个凯林奇利村,这里曾是一个矿区。遗传学家阿卜杜勒·阿卜杜拉劳伊(Abdel Abdellaoui)通过基因数据分析发现,和其他地区的人相比,这些生活在前矿区的居民的DNA不同寻常。他们拥有某种基因变异的数量更多,而这种基因变异,被发现与“上学时间短”这类行为特征有“相关性”。这项研究发表在11月的《自然——人类行为》杂志上。

你可能觉得,研究一个矿区里人的行为特征,这个取样太小了吧,有没有普遍性啊?

一个叫社会科学遗传学联盟的机构,曾经在更大范围内,做过类似的研究。这家机构的专家,从2013年到2018年,完成了三次这类研究。在最近的一次研究中,专家们对110万欧洲人的后裔进行了数据分析,找到了1271个与受教育年限有关的基因变异。这也是迄今为止此类研究中规模最庞大的一个。

研究认为,这些基因变异综合在一起,可以解释欧洲人后裔的受教育年限11%的差异。这听起来可能有点难懂,11%是什么概念?给你个类比,家庭收入与教育年限有关联,这个好理解吧?收入高,在一定程度上会增加受教育的年限。基因变异跟教育年限之间的关联度,跟家庭收入和教育年限之间的关联度是相似的。

除了教育之外,过去这三年中,专家还研究了其他复杂行为,比如他们通过大数据分析,确认了跟幸福感和反社会行为相关的基因变异。

说到这里,你可能会问,大数据分析早已不新鲜了,为什么最近几年才大规模地用来研究基因和行为之间的关系?

原因是,过去的基因测序太过昂贵,导致这类研究的门槛太高。其实,人类基因组测序早在2001年就首次完成了,但当时分析一个人基因组的成本高达近亿美元!即使到2007年,这个价格仍在1000万美元左右。所以,基因数据在那个时候,对于绝大多数研究者而言只是镜中花,水中月。

但是,之后,随着新一代测序技术的出现,基因测序成本大幅降低了。用业内专业术语来说,这个成本是以“超摩尔定律的速度”下降,比如说,2017年,一个人的全基因组测序成本,只需要1120美元了。这已经够低了吧?但你知道么,到今年,这个成本才500美元。对比一下,这是20年前成本的20万分之一不到。而且,基因测序的耗时也大大缩短,这才让基因和复杂性状的数据分析变得简单可行,能够大规模应用。

那你肯定也知道,现在特别流行的基因测序消费产品,那就更便宜了,也就是100美元左右的成本。

随着成本降低,基因的样本量也出现了井喷式的增长。比如,在前面提到的对于欧洲人的研究,在2013年,样本量只有12万人,但是到了2018年,也就是5年之内,样本量涨了8倍,达到了110万人。随着样本量的猛增,研究质量也明显提升,2013年,该系列研究鉴别出的和受教育年限相关的基因变异只有3个,到2018年则提升到了1271个。

不过,随着用大数据分析的方法来研究基因的难度变小,也有不少人开始担忧:这样的研究,是否会导致基因决定论卷土重来呢?

参与研究的专家,对此已经进行了很多严肃的探讨。主流的观点认为,目前,这一类关于基因和行为关联的研究,更多的是描述性的,而不是解释和预测性的。也就是说,研究基因变异,只能发现基因变异和受教育时长之间的相关性,但是不能用一个人的基因变异来预测他受教育的年限是会更长还是更短。所以专家也提醒,不能让这类研究引发误解和不公平现象,比如,让人误以为,受教育情况是只与基因这个单一因素相关,并因此歧视那些带有某些独特基因变异的人。

前面咱们讲到研究英国矿区居民基因特征的案例,遗传学家阿卜杜拉劳伊就专门澄清说:“我们绝不是在暗示基因是一个人教育成就的唯一决定因素。受教育程度是受到环境和基因综合影响的。”

在欧洲研究的案例里,参与研究的遗传经济学家丹尼尔·本杰明(Daniel Benjamin)也强调,这类研究的结果是建立在相关性的基础上的,因此必须非常仔细和小心地呈现,以防止暗示“基因决定论”。

他还说:“难道我们应该根据多基因分数,让一些人进高级班,另外一些人进补习班吗?这完全不可行。”而且,他特别说明,目前的研究结果适用范围是非常窄的。

在欧洲研究的案例里,研究结果只适用于这里面的欧洲人后裔群体。但如果换一群人,研究结果就并不一定适用了。因为不同的群体,与教育相关的基因变异可能不完全一样;而且,即使在一个群体里,基因变异与教育的相关性也因人而异,这种研究方法并不适合于预测某一个人的教育年限。

当然,仍然有人担忧,随着研究的深入,是否我们会发现基因对于教育的影响,远比我们想象得要高。总有一天,基因决定论以及相关的一系列歧视问题,会卷土重来。我们应该怎么应对呢?

其实,就像很多前沿的技术或者科学成果一样,这一类的研究最终是让人类社会受益还是受损,取决于它如何被使用。对于基因分析,这个领域的很多科学家认为,我们可以主动寻求“负责任的”研究方式。

比方说,对于一个人的学习行为或者教育成果来说,一直以来人们都在争论天赋和环境的影响,到底哪个更重要。但对于教育这个领域来说,真正需要解决的问题,是怎么做,才能让教育变得更有效。如果科学家能认识到,基因对教育成果的影响到底有多少,那就可以在研究中把基因的影响剥离出去,这也会帮我们更清晰地评估其他因素扮演的角色——比如说家庭、同学、学校的教学方式的作用,以及帮助我们思考,如何改善这些我们可以控制、干预的因素。

也就是说,我们最终还是要回到解决问题的思维方式,而不是简单评判的思维方式。

好,总结一下。在今天的《邵恒头条》中,我为你介绍了遗传学领域的一个新趋势:随着基因测序成本的下降,有越来越多的科学家开始使用大数据分析的方法,研究基因对于复杂行为的影响。在英国和欧洲的两项研究中,都发现了跟受教育时间长短相关的基因变异。这也给整个社会提出了一个问题:基因决定论是否会卷土重来?

对于这个问题,遗传学领域的主流声音认为,一方面我们不能把数据的相关性理解为因果性,不能认为基因是复杂行为的决定性因素。另一方面,科学家也要给研究的用途主动划定边界。

最后,再说一点我的感受。在这次的哈佛教育和科技论坛上,我跟现场的观众分享了罗胖关于知识的一个看法:他认为知识有三类:一类是what,是什么;一类是why,为什么;比如说,什么是基因分析?为什么基因会对教育年限有影响?这属于what and why。但还有一类知识,是How,怎么办。人类社会中很多维度的进步,本质上都是把what和why的知识,转化为How的问题,也就是转化为解决方案的过程。

好了,这就是今天的《邵恒头条》。我是邵恒,我们明天见。

《邵恒头条》146期:为什么印尼教育部长值得你关注?

《邵恒头条》146期:为什么印尼教育部长值得你关注?

《邵恒头条》145期:什么是社交网络的暗黑心理?

《邵恒头条》145期:什么是社交网络的暗黑心理?

《邵恒头条》144期:如何突破用户增长的极限?

《邵恒头条》144期:如何突破用户增长的极限?

《邵恒头条》143期:为什么会出现“全球领导力真空”?

《邵恒头条》143期:为什么会出现“全球领导力真空”?

《邵恒帮你问》:如何用行为经济学炒股?

《邵恒帮你问》:如何用行为经济学炒股?

《邵恒头条》142期:数据如何“资产化”?

《邵恒头条》142期:数据如何“资产化”?