RaTG13违背自然规律的遗传证据

From 爆料百科
Jump to navigation Jump to search

关联组

经过分析判断RaTG13蝙蝠冠状病毒是伪造的

条件组

SARS-CoV-2的早期毒株样本的组成蛋白与基因组全序列

ZC45与ZXC21的组成蛋白与基因组全序列

RaTG13的组成蛋白与基因组全序列

NCBI分析工具

详情

本词条是基于闫博士报告的再编辑

证明RaTG13具有欺诈性的遗传证据

在对相关病毒的特定基因特别是刺突的序列进行仔细研究后,我们发现了这一证据。具体来说,我们比较了两种病毒在每个基因上的同义和非同义突变,我们对两对病毒进行了比较。第一对是蝙蝠冠状病毒ZC45和ZXC21。第二对是SARS-CoV-2和RaTG13。对这两对病毒进行比较的理由如下。首先,ZC45和ZXC21与SARS-CoV-2的基因组序列一致性各为89%,和SARS-CoV-2及RaTG13最为接近。其次,ZC45和ZXC21的彼此相同度为97%,而SARS-CoV-2和RaTG13的相同度为96%。不仅每种情况下的序列一致性相当,而且序列一致性高,说明在每对病毒中,序列差异应该是进化过程中随机突变的结果,这就保证了这里的同义和非同义分析是合适的,不会因为突发性进化事件(如重组)而变得复杂。事实上,序列比对证实了这种情形--在这两种情况下,曲线都是平滑的,并且始终保持高序列一致性(图3)。


SARS-CoV-2 and RaTG13,ZC45 and ZXC21 ident.png

图3. 简化分析表明,两对冠状病毒都具有较高的序列一致性。

A. RaTG13的基因组序列与SARS-CoV-2的基因组序列对比。

B. ZXC21 的基因组序列与 ZC45 的基因组序列对比。


详细的同义性(绿色曲线)和非同义性(红色曲线)分析如图4所示。对于每个基因,当按顺序分析密码子时,分别说明同义和非同义突变的积累情况。对于刺突基因,在ZC45和ZXC21之间,同义/非同义之比为5.5:1(图4A左,94个同义突变和17个非同义突变)。值得注意的是,两条曲线的趋势大致同步。这些图形在一定程度上反映了该B系β冠状病毒亚群进化过程中随机突变导致的进化特征。


然而,对SARS-CoV-2和RaTG13的刺突基因进行同样的分析,却发现了不同的情况(图4B右)。虽然整体的同义/非同义比例是相似的5.4:1(221个同义突变和41个非同义突变),但两条曲线之间的同步性是不存在的。在序列的后半段,即宽度超过700多个密码子(2,100个核苷酸),当同义曲线持续大幅攀升时,非同义曲线则保持平坦。


统计S2区(对应SARS-CoV-2 刺突的684-1273残基)的同义和非同义突变,发现在ZC45和ZXC21之间,共有27个同义突变和5个非同义突变,同义/非同义之比为5.4:1。相反,在同一S2区,SARS-CoV-2和RaTG13之间,共有88个同义突变和2个非同义突变,同义/非同义之比为44:1。表1总结了S2、整个刺突和其他大型病毒蛋白(Orf1a、Orf1b和核壳Nucleocapsid)的同义/非同义比率。虽然两组之间所有其他蛋白质的比率是可比的,但S2蛋白质的比率是显著不同的。


SARS-CoV-2 and RaTG13,ZC45 and ZXC21 synonymous and non-synonymous.png

图4. 通过比较,揭示在RaTG13和SARS-CoV-2刺突蛋白中同义和非同义突变的异常分布。

分析了大型病毒蛋白上紧密相关的冠状病毒之间的同义和非同义突变:A.刺突蛋白(Spike),B.Orf1a蛋白,C.Orf1b蛋白和D. 核蛋白(N蛋白)。

在每组图中,左图是两种蝙蝠冠状病毒ZC45(MG772933)和ZXC21(MG772934)之间的比较,右图是SARS-CoV-2(NC_045512)和RaTG13(MN996532)之间的比较。在每个图中,绿色曲线代表同义突变累计增长;红色曲线代表非同义突变累计增长;蓝色曲线代表框内删除累计增长。使用EMBOSS Needle完成初始序列基准,然后在www.hiv.lanl.gov进行密码子比对。同义-非同义分析也是在www.hiv.lanl.gov[1]使用SNAP完成的。


在SARS-CoV-2 and RaTG13,ZC45 and ZXC21蛋白中观察到的同义与非同义突变的比率.png

表1. 在不同病毒蛋白中观察到的同义/非同义突变的比率


详细的Orf1a,Orf1b和N蛋白同义/非同义分析如图4B-D所示。值得注意的是,与发生在刺突蛋白的情况相似,在ZC45和ZXC21比较中观察到Orf1a蛋白的两条曲线之间近似同步(4B左图),而SARS-CoV-2和RaTG13比较中观察不到(4B右图)。

S2蛋白维持刺突蛋白的三聚体形成,通过连续裂解暴露出融合肽后,介导膜融合和细胞进入。尽管S2蛋白质比S1蛋白进化更为保守,但由于很高的同义/非同义比率造成的S2蛋白极高的净化压力是非同寻常的。实际上,Orf1b蛋白是冠状病毒中最保守的蛋白质,但是当比较SARS-CoV-2和RaTG13时,其同义/非同义比率仅为10.8:1,远低于观察到的S2蛋白的44:1的比率(表1)。此外,由于RaTG13和SARS-CoV-2感染的物种不同,因此当比较这两种病毒时,S2蛋白的高纯化选择是不可预期的。



在随机选择的20条SARS-CoV-2序列中观察到了刺突蛋白的阳性选择,而不是纯化选择.png

图5.在随机选择的20条SARS-CoV-2序列中观察到了刺突蛋白的阳性选择,而不是纯化选择。

GenBank登录号如图6所示。病毒的收集日期为2019年12月至2020年7月。


随机选择的20条SARS-CoV-2序列的S2蛋白684-1273中观察到5个氨基酸突变.png

图6.在随机选择的20条SARS-CoV-2序列的S2蛋白(684-1273)中观察到5个氨基酸突变。

它们的位置分别为829、1020、1101、1176和1191。每个分离株的GenBank登录号是国家名称后加序列名称。


与上述观点一致,对20个随机选择的SARS-CoV-2序列的刺突蛋白进行的同义/非同义分析表明,在过去8个月的人传人病例中,S2蛋白处于阳性选择而不是纯化选择(图5)。对于这20个SARS-CoV-2分离株,在S2蛋白的5个不同位置观察到了氨基酸突变(图6)。此外,最近的一项研究分析了2954个SARS-CoV-2基因组,发现在S2蛋白的25个不同位置观察到了突变[2],进一步证明S2蛋白可以耐受氨基酸突变,并且对S2蛋白应观察不到高纯化压力。显然,SARS-CoV-2与RaTG13在S2蛋白区域上发现的同义/非同义比达44:1是异常的(表1),违反了自然进化的原理。


对这一观察结果的逻辑解释是,SARS-CoV-2和RaTG13不能通过自然进化相互结合,两者至少一个必须是人工合成的。如果一个是自然进化的产物,那么另一个肯定不是。也有可能它们都不是自然存在。


如果RaTG13是真正存在于自然界中的病毒,则SARS-CoV-2必须是人工的。


但是,事实是SARS-CoV-2实际上存在,并且首次出现是在报告RaTG13之前[3]。这样得出的结论应该认为RaTG13是人工的,这种情况与绝大多数人所持该病毒在自然界中不存在,其序列系人为伪造的怀疑论点相一致。


当然,剩下的可能性是SARS-CoV-2和RaTG13都是人造的:一个是物理创建的,另一个仅以制造序列的形式存在。


RaTG13基因组的序列很可能是通过轻微修改SARS-CoV-2序列以实现总体96.2%的序列同一性而制成的。在此过程中,必须对S1/刺突蛋白的RBM区域进行大量编辑,因为编码之后的RBM决定了与ACE2的交互,因此将受到其他人的严格审查。与SARS-CoV-2过于相像的RBM会很麻烦,因为:

1)RaTG13可以被认为是功能增强研究的产物;

2)它不会为中间宿主留出空间,但是因为刺突蛋白/RBM需要首先适应ACE2受体与hACE2同源的环境,因而公信这种宿主必须存在。此外,修改RBM的序列也是有益的,否则RaTG13有机会可以像SARS-CoV-2一样有效地感染人类,从而加剧了实验室泄漏的担忧。为了消除这种担忧,会在RBM区域引入许多非同义突变。


重要的是,通常在ORF/蛋白质层面上经常使用同义/非同义分析来表征病毒的进化史[4][5][6]。在编辑RBM时,执行此操作的专家必须意识到需要为整个刺突蛋白维持合理的同义/非同义比。然而,专家必然是严格限制了刺突蛋白中S2部分中的非同义突变的数量,最终导致曲线变平(4A右图)。

  1. Korber, B. HIV Signature and Sequence Variation Analysis. Computational Analysis of HIV Molecular Sequences Chapter 4, 55-72 (2000).
  2. Shijulal Nelson-Sathi, P.U., E Sreekumar, R Radhakrishnan Nair, Iype Joseph, Sai Ravi Chandra Nori,Jamiema Sara Philip, Roshny Prasad, KV Navyasree, Shikha Ramesh, Heera Pillai, Sanu Ghosh, TR Santosh Kumar, M. Radhakrishna Pillai. Structural and Functional Implications of Non-synonymous Mutations in the Spike protein of 2,954 SARS-CoV-2 Genomes. bioRxiv, https://doi.org/10.1101/2020.05.02.071811 (2020).
  3. Zhou, P. et al. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature 579, 270–273 (2020).
  4. Li, X. et al. Emergence of SARS-CoV-2 through Recombination and Strong Purifying Selection. Science Advances 6, eabb9153 (2020).
  5. Wang, H., Pipes, L. & Nielsen, R. Synonymous mutations and the molecular evolution of SARS-Cov-2 origins. bioRxiv, https://doi.org/10.1101/2020.04.20.052019 (2020).
  6. Tang, X. et al. On the origin and continuing evolution of SARS-CoV-2. National Science Review 7,1012–1023 (2020).