|  首页  |   关于我们  |  产品中心  |  联系我们  |  诚聘英才  |  
 
 
友情链接
 生物在线
 126免费邮箱
 中小企业招聘网
 新浪网
 中国雅虎网
 生物秀
 生物论坛网
 美国生物信息中心(NCBI)
 医学生物信息中心
 中国科学院
 中国农业科学院
 中国医学科学院
 军事医学科学院
 cell期刊网
 nature期刊网
 science期刊网
 生物网址大全
动植物基因组de novo测序

动植物基因组de novo测序 




       基因组从头测序(de novo sequencing),主要针对基因组序列未知或参考基因组组装不理想的物种,构建不同类型的基因组DNA文库,并进行序列测定。然后使用生物信息学方法对序列进行拼接、组装和注释,从而绘制该物种完整的基因组序列信息。简单基因组:重复序列低于50%,且二倍体杂合度低于0.5%的物种。


复杂基因组:重复序列高于50%,或二倍体杂合度高于0.5%,或其他多倍体物种。


产品参数:


测序方案

测序策略

交付指标

项目周期

简单基因组

纯三代

文库:20Kb 三代(80X)+10XGenomics/Bionano/ Hi-C

Contig N50≥ 1Mb

4-6个月

3+2混合拼接

三代(40X)+二代(PE, 100X)

Contig N50≥ 500Kb

复杂基因组

纯三代

文库:20Kb 三代(100X)+10XGenomics/Bionano/ Hi-C

视物种而定

6-12个月

3+2混合拼接

三代(40X)+二代(PE, 100X)

Contig N50≥ 200Kb

哺乳动物和鸟类

纯三代

文库:20Kb 三代(80X)

Contig N50≥ 3Mb

3个月

3+2混合拼接

三代(40X)+二代(PE, 100X)

Contig N50≥ 1Mb


 

技术线路:

de novo技术路线.jpg

样本要求:

样 本

样本要求

植物组织

嫩叶鲜重2g

高等或大型动物

肌肉组织鲜重2g

微体型动物

动物体累计鲜重2g

昆 虫

正常体型3g,微体型2g

血 液(抗凝)

正常体型3g,微体型2g

 

信息分析内容:

 

序 号

分析项目

类 别

分 析

备 注

1

下机数据统计

A

 

2

数据质控

A

 

3

高质量数据获取

A

 

4

Survey 分析

A

 

5

基因组拼装

A

 

6

基因组拼装效果评估

A

 

7

重复序列分析

A

 

8

非编码 RNA 预测

A

 

9

蛋白编码基因预测

A

 

10

蛋白编码基因功能注释

A

 

11

基因组共线性分析

A

需提供比较物种基因组链接

12

基因家族分析

A

13

单拷贝基因蛋白序列一致性分析

A

14

有效群体大小估计

B

   

15

物种分歧时间估算

B

 

提供特定类群的化石记录

16

基因组圈图绘制

B

   

17

物种特异性分析

C

   

A:标准分析 B:高级信息分析 C: 个性化分析

 
 
分析结果展示:
  • a01.jpg

    基因组结构与基因表达圈图

  • a02.jpg

    基因家族Venn图

  • a03.jpg

    基于基因的共线性分析

  • a04.jpg

    基于单拷贝基因的系统进化树重构

  •  
    经典案例:
     
     

    1、骆驼全基因组测序:

    背景:骆驼是骆驼科,骆驼属的动物,分单峰驼、双峰驼两种。野骆驼生活在中国西北和蒙古西南部,能够忍受酷热和酷寒,并且适应贫瘠和稀缺的植被。骆驼有诸多特性:一天之内,骆驼的体温可能经历从34到41摄氏度的巨大变化;骆驼进食八倍于牛和羊的盐,血糖水平是其他反刍动物的两倍,但并未罹患糖尿病和高血压;骆驼还能制造一种名为重链抗体的抗病蛋白。

    目的:运用Roche 454 FLX+、Illumina和SOLiD平台对骆驼全基因组进行测序,通过与已测序完成的其它物种的比较基因组学分析,研究骆驼的进化历史,从而了解骆驼特殊生活习性和生理特性,解释骆驼在极端环境下生存能力的分子机制,为野生骆驼保护和家养骆驼品种改良提供指导。

    结果:双峰驼全基因组大小为2.38 Gb,发现20,821个蛋白编码基因。在其它已完成基因组测序的物种中,双峰驼与牛的遗传关系更近,预计的分化时间大约在5500万—6000万年前。快速进化分析发现,调节胰岛素信号途径的基因在双峰驼中存在快速进化。研究还发现骆驼具有多个CYP2J基因拷贝,CYP2J基因与高压升高相关。研究同时解析了骆驼嗅觉基因、解毒基因和免疫球蛋白的遗传分子特征。 

    原文索引:[ Meng H, et al. Genome sequences of wild and domestic bactrian camels. Nat Commun, 2012, 3: 1202-1209.]

     
     

     2、蒙古马和普氏野马全基因组测序:

    背景:普氏野马(蒙古野马)(Equus ferus przewalskii)属于马科,原产于蒙古国西部科布多盆地和中国新疆准噶尔盆地东部一带,因此也被称作蒙古野马或准噶尔野马,是世界上仅存的野马,具有6000万年的进化史,被世人誉为“活化石”,是研究家马起源和品系人工选育不可或缺的材料,也是保存马类动物遗传多样性及用于家马性状改良和育种的珍贵物种。蒙古马是中国乃至全世界较为古老的马种之一,主要产于内蒙古草原,是典型的草原马种,被农业部确定为138个国家级畜禽遗传资源保护品种之一。

    目的:运用Illumina HiSeq2000平台对一匹雄性蒙古马和一匹雄性普氏野马全基因组进行测序,同时通过Roche 454 FLX+平台对另外一匹雌性蒙古马的8个组织进行深度转录组测序,以便得到普氏野马和蒙古马的基因组序列和基因注释信息。通过对马属动物核型进化的研究,进而揭示哺乳动物核型进化机制。

    结果:雄性蒙古马和雄性普氏野马在拼接组装中分别组装了2 Mb和3 Mb的Y染色体序列,获得了迄今为止更完整的马的Y染色体的序列图谱;通过蒙古马5号染色体与普氏野马23、24号染色体间的序列相似性分析,确认了蒙古马和普氏野马间的一次染色体罗伯逊易位事件,并且发现罗伯逊易位并没有导致染色体更多的局部重排,说明罗伯逊易位和染色体局部重排可能是由不同的机制引起的。研究还发现两种重复序列对基因组的不稳定性有着强烈的影响。

    原文索引:[Huang J L, et al. Analysis of horse genomes provides insight into the diversification and adaptive evolution of karyotype. Sci. Rep, 2014, 4: 4958.]

     

    常见问题:

    • 基因组框架图和精细图有什么不同?

      框架图能覆盖基因组常染色体区域90%,覆盖基因区域95%,Contig N5到5 kb,Scaffold N50达到20 kb,单碱基错误率在十万分之一以下。精细图能覆盖基因组常染色体区域95%,覆盖基因区域98%,Contig N5到20 kb,Scaffold N50达到300 kb,单碱基错误率在十万分之一以下。

    • 动植物基因组从头测序时为什么需要构建不同类型的文库?

      因为动植物基因组大、复杂度高,且存在大量的重复区域,因此需要制备不同梯度的测序文库,进行双末端测序,使得在拼接中能够跳过大范围的重复区,从而避免了基因组中重复序列造成 的错拼,提高了拼接的质量;同时结合BAC或Fosmid文库以及多种测序平台的综合运用,保证了测序的准确性和基因组的完整性,高效经济的完成高等动植物的基因组图谱绘制。

    • 在动植物基因组从头测序中,不同测序平台分别有什么优势?

      以Illumina 为代表的二代测序平台,具有测序数据量大,成本低,可以为基因组测序提供高覆盖率的数据的优势。但是该平台存在读长短、具有 GC 偏好性等特点,难以跨过重复序列区域和高 GC 含量的区域。以PacBio 公司的RS II和Sequel 平台为代表的三代测序平台,具有读长长(平均reads 长度 > 10 kb)、测序速度快(运行时间短,单个SMRT Cell的运行时间为2~6 hour)、通量高(平均每个 SMRT Cell 产生~8G有效数据)、无 GC 偏好性、能检测碱基修饰信息(包括甲基化修饰)、无 PCR 偏向性(不需要经过 PCR 扩增,避免测序覆盖的不均一性)等特点,尤其适合动植物基因组的从头测序。根据物种基因组的特点及复杂程度,公司会科学地设计测序实验方案,合理地将多个平台搭配在一起使用,既能解决复杂基因组的测序难题,保证基因组测序的质量,同时也能兼顾实验项目的经济性。

公司电话:010-65945597/65919547    传 真:010-65919547   E-mail:biogenro88@126.com
宝杰罗新网站:宝杰罗生物科技有限公司    京ICP备08004776-1    京公网安备110105010393