官网报名参加2025年非全日制研究生报名的考生请在研招网注册账号,使用注册的账号和密码登录研招网统考网报系统。考生浏览报考须知和公告清楚要求后,开始填写考生信息,填写个人信息、教育背景、工作经历等并上传近期照片。系统会提前开通,提前填写好待......
2025-03-30 973
原创 eryun 云生信学生物信息学
原创不易,关注支持我们
胚细胞拷贝数变异(CNV)和体细胞拷贝数变异(SCNA)在各种系统性综合征和癌症中具有重要意义。尤其在癌症研究领域,CNV已被多项研究证明参与了癌症的发生和发展,其数量和复杂度是很多疾病非常重要的诊断指标。随着高通量测序技术的成熟,可以根据测序reads的序列深度变化来推断基因组的拷贝数信息。CNVkit就是专门开发用于全基因组尺度拷贝数检测的一款软件。该软件的一大特点就是同时使用捕获的靶序列reads和非特异性的脱靶序列reads来推断分布在整个基因组中的基因拷贝数。
工作原理
CNVkit工作流程图
CNVkit使用捕获的靶标reads和非特异性捕获的靶标外的reads来计算每个样品在基因组中的拷贝比率(log2)。简单说就是,根据靶标区域之间的基因组位置来调配脱靶集合。然后,将靶标区和靶标外的位置分别用于计算每个间隔内的平均reads深度。再将靶标区和靶标外的reads深度进行组合,并根据对照样本得出的参考值进行归一化,并同时针对多个系统偏差进行校正,以得出最终的拷贝比率(log2)表。接着基于比率值(log2)运行内置的分割算法,推断离散拷贝数分段情况。最后对结果进行可视化并作进一步分析。
性能优势
软件依赖的计算机资源很少,拷贝数检测最耗时的步骤是reads深度计算,使用单个3.7 GHz的 CPU,配合固态硬盘,计算覆盖度100倍的外显子组大约需要20分钟,而覆盖度500倍的293个基因panel数据仅需要大约2分钟。
作者使用源自黑素瘤的C0902细胞系,比较了整个基因组中CNVkit和阵列基因组杂交CGH以及FISH的复制比率,CNVkit推断的拷贝数比率非常接近FISH观察到的平均值。
通过三个不同测序策略的数据比较了CNVkit与其他阵列基因组杂交方法(CONTRA 和 CopywriteR)的每个靶基因上的估计拷贝比率的差异,无论是再有参考基因组还是无参考基因组中方法计算的准确性(特异性)和召回率(敏感性),甚至是单个碱基对的精确度,CNVkit都显示出良好的性能优势。
总之,无论是在靶标reads还是非靶标reads,CNVkit都可以最大限度地利用靶标测序reads,提供高准确和可靠的基因组尺度的拷贝数估计。
使用说明
参考官方网站或者Github地址:https://github.com/etal/cnvkit
下载安装
使用conda:conda install cnvkit
或者使用:pip installcnvkit
运行示例
cnvkit.py batch*Tumor.bam --normal *Normal.bam --targets my_baits.bed --annotate refFlat.txt --fastahg38.fasta --output-reference reference.cnn --output-dir results/ --diagram–scatter
cnvkit.py为主脚本;batch可以调用脚本命令;Tumor.bam 和Normal.bam为对应样本的bam文件,建议用bwa-mem模式;--targets分析区域;--annotaterefFlat格式的基因注释信息,可以从UCSC上下载;--fasta 参考基因组;--output-reference 输出的reference.cnn可以作为下一批tumor数据分析的输入文件,reference.cnn和输入的normal.bam有关;--output-dir输出目录名;--diagram –scatter绘图参数。
参考文献
Talevich E, ShainAH, Botton T, Bastian BC (2016) CNVkit: Genome-Wide Copy Number Detection andVisualization from Targeted DNA Sequencing. PLoS Comput Biol 12(4): e1004873.https://doi.org/10.1371/journal.pcbi.1004873
尔云间 一个专门做科研的团队原创eryun云生信学生物信息学原创不易,关注支持我们胚细胞拷贝数变异(CNV)和体细胞拷贝数变异(SCNA)在各种系统性综合征...
④生物信息系统 近年来主要科研工作和成果: 植物、动物和病毒的分子进化研究,水稻功能基因组分析,疾病基因的定位、克隆、鉴定及相关生物信息学分析,生物信息系...
标签: 生物信息学
相关文章
官网报名参加2025年非全日制研究生报名的考生请在研招网注册账号,使用注册的账号和密码登录研招网统考网报系统。考生浏览报考须知和公告清楚要求后,开始填写考生信息,填写个人信息、教育背景、工作经历等并上传近期照片。系统会提前开通,提前填写好待......
2025-03-30 973
1、辽宁省名校联盟2025年高考模拟卷调研卷地理(一)的要点概述:试卷结构与内容分布 选择题:预计包含自然地理、人文地理、区域地理及地图与地理信息技术等多个模块,旨在考察学生对地理基础知识的掌握程度及运用地理原理分析问题的能力。2、山东名校......
2025-03-30 833
1、要查询晋中学院的学生考试成绩,首先你需要访问教务管理系统。登录的官方网址是http://jwc.jzxy.edu.cn/。进入网站后,找到并点击信息查询选项,接着在下拉菜单中选择学生成绩查询,然后点击查询按钮,你的成绩就会显示出来。2、......
2025-03-30 986
综上所述,初中毕业是可以直接上大专的,学生可以根据自己的实际情况和需求选择合适的学习方式。但需要注意的是,无论选择哪种方式,都需要付出努力和时间来学习和准备考试。初中毕业,可以直接上大专,主要有以下三种方式:五年一贯制大专:这是针对初中生直......
2025-03-29 656
在北京市,想要通过高考成绩进入清华大学和北京大学,一般情况下,分数需要达到590分以上。然而,具体分数要求会因不同专业而有所差异。清华大学和北京大学作为中国顶尖学府,各专业录取分数存在较大差异。例如,理工科专业的录取分数通常较高,而文科专业......
2025-03-29 610