进化树怎么画 进化树( 二 )


用于展示具有亲缘关系的物种/基因之间的 种系发生 (phylogeny)历史的树状图(dendrogram),就是 系统发育树 (phylogenetic tree),俗称进化树 。我们很容易可以从一棵树上看到哪个物种跟哪个物种更相似,可是当我们真正要用一段话去描述这棵树的时候,往往有点不知所措 。这里,我将介绍一下系统发育树是怎么看的 。
首先来学习一下 系统发育树的基本结构。故名思意,系统发育树具有与树类似的结构:
1. 根 (Root)
所有分支的共同祖先叫做根 。根据有无根可分为:
2. 进化支 (Branch)
从根开始生长,每次分出两条枝也叫分支,指两种及以上的生物或序列组成的进化关系 。
可以利用这个来看同源 。比如,下图中人基因1与人基因2可能是旁系同源基因,而人基因1与鼠基因1可能是直系同源基因 。
3. 结点 (Node)
枝生长到一定程度后,再次分枝的地方称为 内节点 (internal node) 。每个结点代表一个分类单元,物种上可以是属,种群等,基因上可以是基因家族,同源物等 。
4. 叶节点(leaf)
树的最末端称为 叶节点 (leaf),有时候也叫tip 。
5. 进化枝(clade)
包含多个叶节点的分支称为 进化枝 (clade) 。
以上是树的基本结构 。如果只有这些结构,还不能称其为系统发育树,只能说是一个树状图 。只有当我们赋予该 树状图 以 生物学意义 的时候,才能称为系统发育树:
除了以上基础结构,有的系统发育树还包含以下内容:
1. Bootstrap检验
对于进化树评估一般会使用 Bootstrap 进行检验 。
Bootstrap检验,自举法检验,也叫自展,自助法 。其实就是放回式抽样统计法的一种,通过对数据集多次重复取样,构建多个进化树,用来检查给定树的分枝可信度 。
2. 重复取样值
那么重复取样的次数会在建树时设置,现在一般文章要求Bootstrap 取样值 1000 。
3. Bootstrap value 阈值
虽然根据严格的统计学概念,自展值需要要大于95%才较为可信 。
然而在实际应用中,我们一般认为结点的 Bootstrap value70,这个分支就是可靠的 。特别是微生物等相似度比较大的分类中,一般大于50%就认为可信(小于50%不会显示) 。
4. Bootstrap value 与分支
如果低 Bootstrap value 更靠近分支末端,代表相似度太高而很难区分
如果低 Bootstrap value 更靠近根,代表相似度太低
一个单系群 (monophyletic group)包括所有的拥有一个共同祖先的物种 。在系统发生树上,单系统组包括一个节点和该节点的所有后代,由节点和末端分类单元表示 。因此,一个单系群也可以看作是一个进化枝 。
图中节点1和物种B、C组成一个单系群,节点2和物种A、B、C也可以组成一个单系群,所以单系群之间可以有包含关系,对一个单系群的确定却决于节点的选择 。
类似于单系群,并系群(Paraphyletic Groups)也是一组包含了共同祖先的物种,不同的是并系群并不一定包含这个共同祖先的所有后代 。
图中节点2和物种A、B组成的并系群,可以看作是上一张图中深蓝色标注的单系群去掉物种C 。
多系群(Polyphyletic Groups)指的是一组由不同祖先进化而来的物种
由于基因测序的出现,许多从前的并系群和多系群被拆散并重新定义为单系群,但在结构(解剖,形态和/或发育),生活史和/或生态环境分类中并系群和多系群的存在还是有其意义的 。
1.为什么有的叶节点是物种,有的是基因?
2.有根树和无根树
根据是否指定了根节点,系统发育树可以分为有根树和无根树 。
无根树和有根树图示如下图 。
有根树根的选择应有所讲究,一般选择所研究的材料(根以下的全部材料)的最近的共同近缘种作为外群 。
3. 物种树和基因树长得很像,两者有什么联系和区别?
测序技术发明以前,我们常常用生物的性状来推测物种树 。测序技术发明之后,我们常常用基因序列来推测物种树 。因为基因和物种往往是共同演化的,所以往往有相同的演化模式,因此可以用基因树来推测物种树 。然而由于存在基因缺失、基因水平转移、基因重复等现象,并不是所有基因树都与物种树一致的。如下图,A物种最初丢失了红色的基因,后来又从B物种的祖先中得到了这个基因,导致红色的基因树与物种树不一致 。
参考:
一文读懂进化树(图文详解)系统发育进化树 (Phylogenetic tree):** 一般也叫系统进化树,进化树 。它可以利用树状分支图形来表示各物种或基因间的亲缘关系 。

秒懂生活扩展阅读