基于机器学习翻译,仅供参考
在本教程中,您将使用Geneious使用分子系统发育工具来研究人类免疫缺陷病毒(HIV)的进化起源。您将学习如何从序列比对中构建系统发育树,以及如何查看和操纵树以回答有关HIV-1起源的问题。
介绍:人类和猴免疫缺陷病毒
练习1:系统发育 - 建立HIV和SIV的系统发育史
练习2:HIV和SIV的分子系统发生学
练习3:HIV-1大流行的起源
追求性价比的G级抗体生产与OEM服务提供商
追求效率与质量的生物实验外包服务提供商
生物医学科学研究重点技术领域仪器供应商
不断提供生物领域未知未涉的分析软件整合服务商
基于机器学习翻译,仅供参考
在本教程中,您将使用Geneious使用分子系统发育工具来研究人类免疫缺陷病毒(HIV)的进化起源。您将学习如何从序列比对中构建系统发育树,以及如何查看和操纵树以回答有关HIV-1起源的问题。
介绍:人类和猴免疫缺陷病毒
练习1:系统发育 - 建立HIV和SIV的系统发育史
练习2:HIV和SIV的分子系统发生学
练习3:HIV-1大流行的起源
艾滋病毒是获得性免疫缺陷综合征(艾滋病)的原因,与猿(猴子和猿)免疫缺陷病毒(SIV)密切相关。这些和其他类似病毒是逆转录病毒。逆转录病毒的特征在于它们的RNA基因组,一旦在宿主细胞内,逆转录成DNA然后整合到宿主细胞的基因组中。整合的病毒基因组被称为原病毒。您将与前病毒DNA序列一起工作。
当这些病毒在20世纪80年代初被首次发现时,艾滋病病毒的起源是神秘的。有两种类型的艾滋病毒。艾滋病毒1型(艾滋病毒1)比艾滋病毒2型(艾滋病毒2型)更为广泛并导致更严重的疾病。HIV-1也比HIV-2多得多。HIV-1分为三大类:M,N和O.引起艾滋病(普遍流行)的病毒属于M组。M组又分为几个亚型。您将分析来自HIV-1组M亚型A,B,C,D,F,G,H,J,K的序列。在北美,欧洲和澳大利亚感染人的HIV-1病毒大多来自M组亚型B.艾滋病毒1和艾滋病毒2的所有群体和亚型均在非洲发现。
HIV-1和HIV-2都与在各种非洲灵长类物种中发现的SIV密切相关。这很早就引导研究人员假设艾滋病毒已经从一个或多个非洲灵长类物种跳到人类身上。有人认为,人类和猴子之间的密切接触是作为宠物饲养的,或者是为了食物而猎杀的,因此SIV可以跳伞。在本教程中,您将使用分子系统发育来确定HIV和SIV的进化关系,从而确定HIV来自哪些非洲灵长类动物。
所有逆转录病毒都含有三个大基因:gag,pol和env。gag基因编码形成病毒颗粒(病毒颗粒)衣壳并执行其他功能的几种结构蛋白。所述的pol基因编码几种酶,包括逆转录酶。我们将分析大约2.5千碱基(kb)长的env序列。的ENV基因编码,其位于病毒粒子的表面上,并与宿主细胞表面受体相互作用的两种病毒包膜糖蛋白。
您将分析HIV-1,HIV-2和各种SIV 的62个env序列的比对。由于对齐这么多长序列可能需要相当长的计算时间,因此已经进行了对齐。
点击文件'HIV_Alignment'打开提供的路线。
在查看比对时,请注意,有很多大差距,这是不同物种中快速进化基因比对的特征。
序列以以下格式标记:病毒类型; 其次是SIV序列的灵长类物种的共同名称,或HIV-1和HIV-2序列的组或亚型; 最后是加入号码。
该比对包含来自已知感染不同SIV的各种非洲灵长类物种的序列。还有三种来自亚洲的非非洲物种都感染了被圈养的SIV:猪尾猕猴,恒河猴和st尾猕猴。所有这些灵长类物种的SIV均由每幅图片给出的三字母代码引用。例如,Sooty mangabey的SIV被称为SIVSMM,并且队列或树中的序列被标记为SIV-SMM。
莫娜猴
Cercopithecus mona mona [denti]
MON [DEN]
德布拉扎的猴
Cercopithecus neglectus
DEB
Tantalus猴子
Chlorocebus tantalus
TAN
Syke的猴子
Cercopithecus albogularis
SYK
大斑点猴
Cercopithecus nictitans
GSN
绿猴
Chlorocebus sabaeus
SAB
胡须髭菊
科cephus
MUS
黑毛猴
Chlorocebus pygerythrus
VER
Grivet
Chlorocebus aethiops
GRV
L'Hoest的猴子
Cercopithecus lhoest
LST
Sooty
mangabey Cercocebus atys
SMM
红帽mangabey
Cercocebus torquatus
RCM
太阳猴子
Cercopithecus solatus
SUN
Mandrill
Mandrillu狮身人面像
MND
Drill
Mandrillus leucophaeus
DRL
猪被盯梢的短尾
猿猕猴nemestrina
MNE
树桩尾猕猴
Macaca arctoides
STM
罗猴短尾
猕猴猕猴
MAC
常见的黑猩猩
Pan穴居人
CPZ
您将使用Neighbor-Joining 树木构建方法和Tamura-Nei 模型构建一个系统发育。进化模型描述了每个核苷酸的预期频率和核苷酸之间的变化率。Tamura-Nei模型假定每个基地具有不同的均衡频率,并允许转换和变换以不同的速率发生。它允许两种类型的转换(A↔G和C↔T)具有不同的速率。这在分析HIV序列时很有用,因为HIV表现出由宿主酶(APOBEC3G)引起的超G-to-A突变。您将使用Neighbor-Joining方法,因为这些序列通常不会像时钟一样进化。
打开提供的路线。
要使用Tamura-Nei模型构建一个Neighbor-Joining树,使用引导,单击 Tree按钮并选择Geneious Tree Builder。您应该通过按Reset to Defaults按钮将任何更改的参数重置为默认值(如果此选项显示为灰色,则默认设置已被选中)。
对于遗传距离模型,选择Tamura-Nei 并为树构建方法选择Neighbor-Joining 。将外群设置为“SIV-MON; 莫娜猴; AY340701“ 。这个序列将被用于树根。
要计算树的支持值,请使用引导。为此,请勾选Resample树旁边的复选框,然后在重新采样方法旁边的下拉框中选择Bootstrap 。使用100个自举样本和一个0 的支持阈值。由于您选择的样品越多,分析所需的时间越长,因此不要使用超过100个样品进行此示例分析。如果你想使用提供的树,你可以通过点击这里来完成。
树建筑选项现在应该看起来类似于:
点击OK 建立树。
树构建器完成后,树文档将出现在Geneious的文档表中,并应自动打开。
系统发育树是进化关系的分支图。它包含关于一组生物体内进化分歧的顺序的信息,并因此包含关于它们之间的关系的信息。它还可以包含有关任何两个分支事件之间发生的演化变化量的信息。树上的线称为分支,这些线的交点称为节点。节点表示树中的分支事件。树的分支模式称为拓扑。拓扑结构显示生物体如何相互关联。
根据屏幕大小和树的大小,可能无法在树上显示所有序列名称,因此Geneious将只显示一些序列名称。要放大树,请使用树视图右侧面板中“常规”下的缩放滑块。要扩展树的分支之间的距离,请使用扩展滑块。随着分支之间的空间量增加,更多的序列名称将显示在树上。
由于此树是使用Geneious中的对齐创建的,因此该对齐将附加到树上。点击“对齐视图”标签查看对齐。
对齐中的序列根据树的拓扑排序。在序列名称的左侧,您可以看到树形拓扑(如果您使用大型树,这可能不可见)。选择“SIV-MON; 莫娜猴; AY340701“序列中,然后返回到”树视图“。这个序列现在也在树中被选中。
用于构建此对齐和树的序列具有与它们相关联的其他元数据(这是在各个序列文档的“信息”选项卡的“属性”字段中找到的数据)。这些信息可以显示在树的尖端。要在树的顶端显示生物体,请从“显示提示标签”下的“显示”旁边的框中选择“生物体”。
要显示生物体和宿主生物体,请按住Ctrl(在Windows上)或Cmd(在Mac上)并选择“生物体”和“宿主生物体”。现在,宿主生物体和生物体显示在树的顶端,用逗号分隔。要在树上显示序列名称,请选择“名称”。
正如可以使用不同字体或墨水颜色打印句子而不改变意义一样,树木也可以用不同形状和方向表示。即使外观发生变化,树中编码的信息仍然保持不变。例如,可以通过旋转分支组来改变树的外观。要旋转分支,请在树中选择一个内部节点,然后单击窗口顶部的“ 交换兄弟” 按钮。这将旋转该子树中的分支; 然而,相关程度并没有通过在树中旋转分支来改变。简单地把两个名字放在一起,并不意味着任何密切的关系。
试试这个你创建的树。在包含Grivet猴子和四只Vervet猴子的树中选择节点,然后单击Swap Siblings 按钮。
这些样本的顺序会在树上发生变化,但是来自Grivet猴子的样本与来自四只Vervet猴子的样本之间的关系并没有改变。
树木可能根本没有根。要将HIV树视为无根树,请单击树视图右侧面板中“常规”选项下的一个无根视图。
无根的树木不会告诉我们关于进化关系的很多内容。我们无法确定哪个节点是祖先,哪些是树上的后代节点。为了建立祖先 - 后代关系,我们需要确定一个合适的群组,然后在分支上分支树和树的其余部分(内部群)。我们可以在构建树之前指定根来生成有根树,或者可以在构建树之后指定根,以将无根树更改为有根树。
当你建立HIV和SIV序列的树时,你指定了一个外群(“SIV-MON; Mona monkey; AY340701”),所以Geneious生成了一棵有根的树。要将树视为有根树,请单击树视图右侧面板中“常规”选项下的有根视图。
根系的系统发育树可以如上所述水平定向,或垂直定向。这里的时间轴是隐含的,从左到右运行。树左端的节点是根节点,它代表树上最老的点。当我们从根节点移动时,我们可以识别祖先到其后代分支的节点。从树的顶端进行工作,使我们能够识别近亲和远亲。任何两个有机体的亲缘关系的程度是由你在寻找它们共同的祖先所必须去的有根树上返回多远而给出的。如果在追溯到A和B的共同祖先时,你通过了A和C的共同祖先,那么你可以说A和C比A和B更相关。
在有根树上,每个节点及其所有后代节点形成一个分支。这就是我们通常称之为真正树上的“分支” - 物理分支和附属于它的所有小分支和叶子。因为无根树没有上述时间轴,所以在这种情况下讨论分支是不合适的。
树的分支的长度可以是任意的(例如,包络图),或者可以表示进化变化(phylogram)的量。
在一个曲线图中,分支的长度与这些分支事件之间发生的变化量成正比。由于您构建的树是使用距离(1-相似性)度量(即NJ)估计的,因此节点的邻近度表示它们的总体相似度。
要显示树分支的长度,请在树视图右侧的面板中,从“显示分支标签”下的“显示”旁边的下拉框中选择“每个站点的替代”。
在你的树上,找到“SIV-MAC; 猕猴; M33262“和”SIV-MNE; 猪尾猕猴; U79412“,并查看分隔这两个分类群的分支的长度。现在找到“SIV-MND; 山魈; AF328295“和”SIV-MND; 山魈; AF367411“并查看这些分支的长度。分支“SIV-MAC; 猕猴; M33262“来自”SIV-MNE; 猪尾猕猴; U79412“短于分隔”SIV-MND“的分支的长度; 山魈; AF328295“和”SIV-MND; 山魈; AF367411” 。由此可以得出结论:“SIV-MAC; 猕猴; M33262“更类似于”SIV-MNE; 猪尾猕猴; U79412“,而不是”SIV-MND; 山魈; AF328295“是”SIV-MND; 山魈; AF367411” 。
如果使用最优性方法(例如MP或ML)来估计树,则两个节点的邻近度反映估计在它们之间发生的字符状态的演化变化的数量。如果从一棵树的根部到另一端的有机体A的树根的总分支长度远远大于从另一端的根到有机体B的总分支长度,则可以说A谱系中的进化比在B谱系中更快该树所基于的字符。
要将树变换为包络图,请在“格式”选项中勾选变换分支框。在Transform 旁边的下拉框中选择Cladogram
注意树的分支长度是如何变化的,并且树的所有提示都在树视图的右侧对齐。通过这种转换,分支的长度是没有意义的。如果你现在看“SIV-MAC; 猕猴; M33262“和”SIV-MNE; 猪尾猕猴; U79412“,然后看看”SIV-MND; 山魈; AF328295“和”SIV-MND; 山魈; AF367411“你可以看到分支长度分开”SIV-MAC; 猕猴; M33262“来自”SIV-MNE; 猪尾猕猴; U79412“与分隔”SIV-MND“的分支具有相同的长度。山魈; “来自”SIV-MND的AF328295“; 山魈; AF367411” 。对于转换的分支,你不能得出关于如何类似“SIV-MAC; 猕猴; M33262“是”SIV-MNE; 猪尾猕猴; U79412“与”SIV-MND“的相似程度进行比较。山魈; AF328295“是”SIV-MND; 山魈; AF367411” 。
要将树转换回phylogram,请取消选中Transform branches 。要隐藏分支长度,请取消选中“显示分支标签”旁边的框。
除了由树的拓扑结构和树的分支长度传达的信息之外,还可以在树的节点和/或分支上写入更多信息。可用于显示的信息取决于构建树的方法和使用的选项。通常,支持值将显示在树上。
树木建筑方法生成最能解释对齐中信息的树; 然而,这棵树不太可能解释所有的对齐变化。并非所有的对齐站点都支持此树,并且并非树中的所有分支都必须得到对齐的强力支持。例如,对于快速物种形成事件,在比对中可能没有足够的信息来确定一组物种的分支模式,并且树中的一些分支可能只具有比可能的分支更少的支持。
如果你看看你建造的这棵树,很难分辨哪支支持强烈支持,哪些不支持。例如,包含“SIV-GSN; 大斑点猴子; AF468659“和”SIV-GSN; 大斑点猴子; AF468658“具有与包含”SIV-MND“的分支相同的支持; 山魈; AF328295“和”SIV-MND; 山魈; AF367411” ?
要找出对齐支持树中每个分支的强度,我们可以计算支持值。在树形建筑选项中,您选择了“Bootstrap”重采样方法。树中分支的引导统计量是分支出现在引导复制树集合中的百分比。这个百分比范围从0%(分支没有出现在任何引导树中)到100%(分支出现在所有引导树中)。引导复制树是通过从对齐中随机抽样站点和替换来生成的,以创建一个新的随机对齐,然后从这个抽样对齐构建一棵树。对于指定数量的自举复制重复此过程(在您的情况下,这是500)。
要在树上显示引导值,请勾选显示分支标签旁边的复选框,然后从“显示”旁边的下拉框中选择共识支持(%)。
分支的引导值将显示在该分支最近的共同祖先节点的左侧。
现在引导值显示在树上,您可以看到对包含“SIV-GSN; 大斑点猴子; AF468659“和”SIV-GSN; 大斑点猴子; AF468658“,但不适用于包含”SIV-MND; 山魈; AF328295“和”SIV-MND; 山魈; AF367411” 。
问题1:哪些非洲灵长类动物人类感染HIV-1? > |
问题2:发生了多少次?解释你的答案。 > |
问题3:你的结论有多少bootstrap支持? > |
问题4:哪些非洲灵长类物种人类感染HIV-2? > |
问题5:这似乎发生了多少次?解释你的答案。 > |
问题6:你对结论有多少引导支持? > |
问题7:这些亚洲猕猴物种是从哪个非洲灵长类动物中俘获SIV的? > |
在试图理解为什么HIV-1大流行开始时,其中一个关键问题是“它是什么时候开始的?”从有限的分子序列数据的早期分析到更多近期对更多丰富数据的分析,以下假设已被建议:
通过计算HIV-1流行病毒株何时产生来检验这些假设。你可以做到这一点,因为尽管序列往往不会像整个树上以时钟一样的方式进化,但是HIV-1大流行分离株的序列确实似乎以类似时钟的方式进化。
使用您生成的树,查看从HIV-1组M序列(亚型AK)到其共同祖先的分支长度。您将需要使用“ 常规” 选项卡下的缩放功能来清晰地查看这些分支及其长度。根据需要调整字体。
问题8:计算从分支尖端到M组的共同祖先的平均总和。(要查看树上的分支长度,请从“Show Branch Labels”下的“Display”旁边的下拉框中选择“Substitutions per site” “) > |
问题9:假设HIV-1的替代率每代每个核苷酸位点约有10-5个替换,使用分支长度的平均和来计算从M组序列偏离共同点后已经过去了多少HIV-1世代祖先。 > |
问题10:艾滋病病毒1代持续约2天。这是病毒颗粒感染细胞并产生新的病毒颗粒以准备感染新细胞所需的时间。从这一代开始,计算出多少年前M组序列与共同祖先分离。 > |
问题11:假设平均抽样年为1990年,大约在哪一年艾滋病毒1型流感大流行发生? > |
问题12:以上有关何时发生大流行病毒序列的假设是否会得到您的结果支持? > |
您已完成本教程。