年的成果。
他们建立了一个大型的数据集,记录了与给定的向导RNA有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
然后把数据喂给了一个两个隐藏层的神经网络,训练出了一个可以输出所有潜在脱靶位点的模型。这是一个生成模型,可以得到每个脱靶位点的概率,据此计算脱靶评分。”
“太普通了,这只是实现了一个二线工具,还有没有更惊艳的?”卢赫追问。
“有。
非同源末端连接机制还记得吧?剪刀剪完基因序列后,不管三七二十一直接把断裂的基因给粘起来。
这种方式并不常用,一般都是用同源模板修复。一方面是剪的时候可能剪了不止一个地方,粘的时候却可能只粘了其中一个。另一方面是细胞不乐意了直接就不粘了。
但有团队利用机器学习算法准确地预测到了细胞容易修复的基因位点,并用cRISpR和非同源末端连接治了病。
为了探索具有代表性的人类基因组序列的修复产物,他们设计了一千多个目标位点,特征是向导RNA和靶标基因,标签是非同源末端连接最终起了修复作用位点。
数据喂给了一个看起来结构很复杂的模型,训练结果很是喜人,模型对11%的向导RNA的修复位点的预测准确率在50%以上。
意味着这些向导RNA和相应靶标基因所对应的疾病,可以用这种方式来治疗。
最终他们治愈了赫曼斯基-普德拉克综合征,一种能凝血不足和白化病的遗传病。体外测试的修复准确率高达94%。
这个够惊艳吗?”
卢赫连连点头,“够。这个思路不错,是不是可以用在你身上,特征是某时间点的基因组,标签是未来的变异位点,提前预测变异,在发病前做修复?”
“没错。”对方肯定道。
“可是这种方式,用在你一个人身上好说,其他人呢?万一我们未来都要跟你一样,总不能每个人都建一个模型吧?”
“也不是不可以。不过还是希望未来有别的办法。这个思路已经被提上日程了,底下四层全是测序中心的地盘。”
卢赫露出了难以置信的表情,继而又满怀期待地追问,“也不对啊,我记得我当初给你测序的时候,你突变的位点很多都在编码区的。也许我们和你不一样。”
“没太大差别,前期确实大都在编码区,但后来也往非编码区发展了。
非编码区早就不是最初认知中的“垃圾”区,随着研究的推进,它的重要作用也被逐渐揭示。之所以我年纪越大越严重,很可能就是因为后期突变在了非编码区。
很显然,那里不是可以随意落笔的空白画布,而是地狱的入口,是禁区。”
对方说完,叹了一口气,便又开始仰头看灯,“我的测序结果放在你家哪里?得尽快派人去取,样本本来就不多,数据很珍贵。”
“不用找别人,我自己去吧,我也不确定在不在,在哪里。”
不一会儿,他又从郑K手里弄到了车钥匙,还收到了一连串的嘱咐:
四通八达的隧道只限本市,去外市有一段路要走地上。
除了第110号掩体以外,其余的都还没有下移动通讯网络,没法定位,需要熟记地图。
这两天天气不错,风不大,能见度好,路上也没人。但别开太快,路面有沙子,滑。
出去之前,找后勤给车上加点配重。