|  首页  |   关于我们  |  产品中心  |  联系我们  |  诚聘英才  |  
 
 
友情链接
 生物在线
 126免费邮箱
 中小企业招聘网
 新浪网
 中国雅虎网
 生物秀
 生物论坛网
 美国生物信息中心(NCBI)
 医学生物信息中心
 中国科学院
 中国农业科学院
 中国医学科学院
 军事医学科学院
 cell期刊网
 nature期刊网
 science期刊网
 生物网址大全
真菌近完成图测序

真菌近完成图测序 




 

 真菌近完成图测序

真菌近完成图测序是指对基因组序列未知或无近缘物种基因组信息的某个物种,构建不同插入片段的基因组DNA文库,采用第三代单分子测序技术结合第二代高通量测序技术对文库进行序列测定,然后利用生物信息学方法进行组装和注释,从而获得该真菌的全基因组和甲基化组。

应用领域

l 获得接近完整的真菌全基因组序列图谱

l 获得甲基化修饰相关信息(6mA和4mC)

l 解析真菌基因组中存在的大片段重复序列

测序优势

(1) 方案设计合理:完成图的方案以三代平台为主、二代平台为辅,平台完美结合,得到接近完整的染色体及线粒体序列;

(2) 完备的样品提取及纯化方案,兼顾 DNA 质量及项目周期;

(3) 免费赠送待测菌株的菌种鉴定,以防菌株错测;

(4) 拼接结果准确:三轮校正(拼接前利用三代测序数据间的 Overlap 对测序数据进行校正;拼接后,利用三代测序数据对拼接结果进行第二轮校正;最后,利用高质量的二代测序数据对拼接结果进行多次校正)使得到的基因组拼接结果更加准确、可靠;

(5) 专业的分析团队,丰富的项目经验,提供个性化的信息分析内容。

送样要求

送样形式

送样要求

菌体

菌体湿重 ≥ 3 g(酵母菌和霉菌)

菌丝球,培养体系 ≥ 1 L,直径1~3 mm(大型真菌)

DNA

总量 ≥ 60 µg(荧光定量)

OD260/OD280 = 1.8~2.0

OD260/OD230 = 2.0~2.2


信息分析内容

序号

分析项目

类型

分析

备注

1

下机数据统计

A

   

2

数据质控

A

   

3

高质量数据获取

A

   

4

Survey 分析

A

   

5

基因组拼装

A

   

6

基因组拼装效果评价

A

   

7

基因组拼装完整性与连续性评估

A

   

8

重复序列分析

A

   

9

非编码 RNA 预测

A

   

10

蛋白编码基因预测

A

   

11

碳水化合物活性酶(CAZy)分析

A

   

12

细胞色素 P450 家族分析

A

   

13

蛋白编码基因的序列比对

A

   

14

蛋白编码基因的 GO 注释

A

   

15

蛋白编码基因的 eggNOG 注释

A

   

16

蛋白编码基因的 KEGG 注释

A

   

17

蛋白编码基因的 Swiss-Prot 注释

A

   

18

蛋白编码基因的结构域分析

A

   

19

序列比对分析

A

   

20

SNP 分析

A

   

21

InDel 分析

A

   

22

基因家族分析

B

 

基因组数量 ≥ 2

23

Venn 绘制

B

 

基因组数量 ≥ 2

24

单拷贝基因的蛋白序列一致性分析

B

 

基因组数量 ≥ 3

25

基因家族扩张和收缩分析

B

 

基因组数量 ≥ 3

26

dNdS 分析

B

 

基因组数量 ≥ 2

27

基于全基因组单拷贝基因的进化树重构

B

 

基因组数量 ≥ 3

28

分歧时间估算

B

 

基因组数量 ≥ 3

29

基因组数据上传

B

   

30

基因组圈图绘制

A

   

A:标准信息分析;

B:高级信息分析。


信息分析流程

高级信息分析内容示例

基于单拷贝的全基因组进化分析

ω值分布图

经典案例:

利用第三代单分子测序技术结合光学图谱技术获得真菌接近完整的全基因组序列图谱

mBio 2015 IF:6.975

关键词:光学图谱技术;端粒;DNA 转座元件;第三代单分子测序技术

研究背景

真核生物中存在大量的重复序列,这些重复序列会对基因组组装造成很大的影响。传统的高通量测序技术受制于读长,无法完全解析这些重复序列。第三代单分子测序技术平均读长可达到 10~15 kb,最长读长超过 60 kb,能很好地解析富含重复的区域。光学图谱技术可用于构建高分辨率的图谱。本研究采用第三代单分子测序技术结合光学图谱技术获得了一个 36 Mb 真菌接近完整的全基因组序列图谱。

实验方法

供试样本:棉花黄萎病菌 Verticillium dahliae

文库大小:22,000 bp,采用 BluePippin 去除 7,000 bp 以下的片段;

测序数据: 14 SMRT Cell P4-C2 + 4 SMRT Cell P5-C3

测序平台:PacBio RS II;

研究结果

(1) 采用单独的 Pacbio 测序数据进行拼接效果最好

(2) 两步法拼接(第一步采用 A5MiSeq对 MiSeq 数据进行拼接;然后采用PBjelly利用 Pacbio 数据进行拼接)相比一步法(直接采用 SPAdes对MiSeq数据和Pacbio 数据进行拼接)拼接效果更好;

(3)Pacbio 测序数据对拼接效果改善非常显著(见表 1);

(4) 相比 MHAP 软件,HGAP 拼接效果更好(三代测序数据);

(5)当三代测序数据量超过 50 ×,数据量的增加对拼接结果的改善非常显著;当测序数据量超过100 ×,数据量对拼接结果的改善效果不显著 (见表 2)。

参考文献

Luigi Faino , Michael F. Seidl , et al. Single-Molecule Real-Time Sequencing Combined with Optical Mapping Yields Completely Finished Fungal Genome. Mbio, 2014, 6 (4).

项目经验

拉丁名

基因组大小

GC含量

派森诺已完成数目

Saccharomyces pastorianus

22.3

39.25

1

Cerrena.sp

43.66

47.48

1

Chaetomium thermophilum

28.32

52.6

1

Aspergillus terreus

29.36

52.2

1

colletotrichum orbiculare

90.08

37.8

1

cladosporium sphaerospermum

38.52

54.3

1

lentinula edodes

41.36

46

1

Fusarium proliferatum

44.18

48.4

2

表一

表二

 
公司电话:010-65945597/65919547    传 真:010-65919547   E-mail:biogenro88@126.com
宝杰罗新网站:宝杰罗生物科技有限公司    京ICP备08004776-1号    京公网安备11010502047286号