测序原理
为什么要学习测序原理?
(资料图片)
1、测序是现在以及未来生物学研究的基础;
2、测序原理是生物数据分析的基础;
3、测序质量直接影响分析结果;
4、生物软件针对特定数据开发;
5、了解测序原理才能选择合适的科学研究方案。
01illumina
illumina 测序的优点:通量大、价格低 、应用广、准确性高,缺点:读长短、速度慢 、双末端、有偏向性。
应用广,如基因组、变异检测,RNAseq,单细胞测序,产前筛查,肿瘤检测等。
读长短,现在普遍2×150bp,最长就2x300bp。但依然比较短,由于Illumina 的技术特点限制了其读长,很难在读长上继续提高。
illumina 测序三大核心技术:
01.可逆阻断终止技术
02.边合成边测序
03.双末端测序
illumina测序原理视频:
https://v.qq.com/x/page/i0770fd7r9i.html
02PacBio
PacBio测序的优点:
1.超长读长:5~70kb
2.准确性高:HiFi模式可以达到 99.999%
3.均匀的覆盖率:无需扩增,不受 GC 偏向影响
4.可检测碱基化学修饰
5.测序速度快:1S测10个碱基
PacBio 的缺点:
1.数据量小
2.单分子测序原始数据的错误率高,需重复测序降低错误率
3.测序价格较高,是llumina的 6-7 倍
4.长度没有纳米孔测序长
5.测序仪成本较高,不适合小规模组织购买
6.提高准确性需要牺牲测序长度和数据量
PacBio测序四大核心技术:
01.DNA Polymerase
02.ZMW Confinement
03.标记在磷酸链上的核苷酸
04.哑铃状文库
PacBio测序原理视频:
https://v.qq.com/x/page/r03534cry7u.html
03Nanopore
Nanopore测序的优点:
1.读长超长
2.速度快
3.通量高
4.电信号
5.无GC偏向性
PacBio 的缺点:
1.准确性低
2.价格高
3.小的插入缺失错误
4.更新快
Nanopore测序四大核心技术:
01.生物膜
02.马达蛋白
03.解螺旋酶
Nanopore测序原理视频:
https://v.qq.com/x/page/v0746ixokzz.html
总的来说,所有测序仪所得到最终分析的格式是fastq,下面来了解下其格式结构吧。
Fastq
第一行:以‘@’开头,是这一条 read 的名字,这个字符串是根据测序时的状态信息转换过来的,中间不会有空格,每条 read 的唯一标识符;
第二行:测序 read 的序列,由 A,C,G,T 和 N 这五种字母构成,这也是我们真正关心的DNA 序列,N 代表的是测序时那些无法被识别出来的碱基;
第三行:以‘+’开头,没啥用;
第四行:测序 read 的质量值,这个和第二行的碱基信息一样重要,它描述的是每个测序碱基的可靠程度。
ASCII 码表
总之,FASTQ格式文件是测序仪经过转化得到的生信分析原始数据(一般公司给的都是fastq)。最重要的是第二列碱基信息以及第四列碱基测序质量值。
好啦,今天的分享就到这啦,明天开始学习Linux咯!