选择模板

更多 发表的帖子

13257

浏览

【讨论】dxy有必须对所有招聘都进行过滤吗

回帖:18    收藏:1    投票:1

2619

浏览

【招聘】浙江理工大学生命科学学院招聘启事

回帖:9    收藏:0    投票:0

1834

浏览

【经验】工作半年了,一些求职与应聘感想

回帖:6    收藏:7    投票:0

更多 最新动态

  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的一般步骤-7 初级统计篇

    这步主要目的是对比对情况,做一个统计。#Make a temp directorymkdir -p ${tmp_folder}_dept#Running GATK depth of coverage  java -Xmx${heap}m -Djava.io.tmpdir...
  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的一般步骤-9 annova注释篇

    ANNOVAR是一个应用非常广的软件,但其并非免费,下载软件时,需要注明非商业使用。虽然现在大家都在用,并没有收费,但权利已经保留了。annova可以同时将各类数据库注释进去,包括cytoband, 千人频率,dbsnp, clinvar, refgene等。由于之前的VCF文件...
  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的一般步骤-8 SNP calling篇

    这步,才正式将比对结果,call出SNP,给出一个非常通用的,大家都熟悉的VCF文件 (variant calling files)SNP, indel是分开call的,同时会对质量进行过滤。从raw data生成PASS的data#Generate snps raw vcf f...
  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的数据格式-4, 注释好的最终文件格式篇

    这个我想也不会很难,具体见附件,这里附个图,示意一下,最关键的是其中一列能看懂就行了。GT:AD:DP:GQ:PL1/1:0,48:48:99:1614,123,0 说明: 1/1表示纯合aa,其中REF为0个,ALT为48个,测序深度为48个,表型的准确性99,(0/0, 0/...
  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的数据格式-2,fastqc格式篇

    这个最容易,用fastqc软件,直接对fastq文件做QC,就能下载到一个文件 分析指标包括: 直接粘图无效,可以自行在附件中下载。• Basic Statistics [基本统计数据]• Per base sequence quality [每测序碱基质量得...
  • zjubell
    zjubell  的帖子被加了1分 22天前

    全外显子分析(WES)的数据格式-1, sam/bam格式篇

    bam文件是一个压缩文件,占用空间小,但记录了所有比对的信息,可以用samtools view来查看至于 samtools view 的用法,自己敲完命令看就行。我来说说这两个文件的格式 1.  QNAME,比对片段的(template)的编号;2. ...
  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的数据格式-4, 注释好的最终文件格式篇 23天前

    这个我想也不会很难,具体见附件,这里附个图,示意一下,最关键的是其中一列能看懂就行了。GT:AD:DP:GQ:PL1/1:0,48:48:99:1614,123,0 说明: 1/1表示纯合aa,其中REF为0个,ALT为48个,测序深度为48个,表型的准确性99,(0/0, 0/1, and 1/1的值为1614,123,0:0为错误最小值所以表型为1/1)WES的搞一段落,其他的有机会再说。

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的数据格式-3 coverage report格式 23天前

    这个好像挺容易,只要会点英语,就能认识,我只是翻译一下

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的数据格式-2,fastqc格式篇 23天前

    这个最容易,用fastqc软件,直接对fastq文件做QC,就能下载到一个文件 分析指标包括: 直接粘图无效,可以自行在附件中下载。• Basic Statistics [基本统计数据]• Per base sequence quality [每测序碱基质量得分]• Per sequence quality scores [测序质量得分分布统计图]• Per base sequence content [每碱基测序组成比例评估分析]• Per base GC content [每碱基GC组成评估]• Per sequence GC content [全部read序列GC百分比分布统计]• Per base N content [每碱基N组成比例评估]• Sequence

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的数据格式-1, sam/bam格式篇 23天前

    bam文件是一个压缩文件,占用空间小,但记录了所有比对的信息,可以用samtools view来查看至于 samtools view 的用法,自己敲完命令看就行。我来说说这两个文件的格式 1.  QNAME,比对片段的(template)的编号;2.  FLAG,位标识,template mapping情况的数字表示,每一个数字代表一种比对情况,这里的值是符合情况的数字相加总和;3.  RNAME,参考序列的编号,如果注释中对SQ-SN进行了定义,这里必须和其保持一致,另外对于没有mapping上的序列,这里是’*‘;4.  POS,比对上的位置,注意是从1开始计数,没有比对上,此处为0;5.  MAPQ,mappint的质量;6.

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的一般步骤-9 annova注释篇 23天前

    ANNOVAR是一个应用非常广的软件,但其并非免费,下载软件时,需要注明非商业使用。虽然现在大家都在用,并没有收费,但权利已经保留了。annova可以同时将各类数据库注释进去,包括cytoband, 千人频率,dbsnp, clinvar, refgene等。由于之前的VCF文件只有绝对坐标,没有具体到哪个基因,哪个外显子,而annovar就是干这个事的,效率非常高,且只要符合他的格式要求,可以自定义注释各类文件。##############################################################  Step . Annotation ANNOVAR###############################################

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的一般步骤-8 SNP calling篇 23天前

    这步,才正式将比对结果,call出SNP,给出一个非常通用的,大家都熟悉的VCF文件 (variant calling files)SNP, indel是分开call的,同时会对质量进行过滤。从raw data生成PASS的data#Generate snps raw vcf file #Using GATK UnifiedGenotyper to generate snps.raw.vcf mkdir $PWDS/variants  java -Xmx${heap}m  \    -jar $gatk \    -R $REF \    -T Unif

  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的一般步骤-7 初级统计篇 23天前

    这步主要目的是对比对情况,做一个统计。#Make a temp directorymkdir -p ${tmp_folder}_dept#Running GATK depth of coverage  java -Xmx${heap}m -Djava.io.tmpdir\=${tmp_folder}_dept \    -jar $gatk \    -T DepthOfCoverage \    -L $ExonFile \    -l INFO \    -R $REF \    -I $PWDS/${subjectID}.realigned.recal.ba

  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-6 过滤篇

    直接比对出来的结果非常乱,会有一堆假阳性,所以需要与金标准进行比对,同时去除一些低质量的背景噪音**注: REF,跟hg_ref是同一定义,有些地方我用的hg19_ref,有些地方我直接用REF,其实应该统一,我懒的改了。先发到这,看看有没感兴趣的,明天继续。##########...
  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-5校正篇

    需要校正双端信息,有时候也可以省略。去除PCR,这个在捕获法中必须加,而在扩增子测序时,要去掉#Make a temp directorymkdir -p ${tmp_folder}_fixmate#Using Picard fixmatejava -Xmx${heap}m -D...
  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-4 对比篇

    用BWA,双端比对#Paired-end first batchecho "pe alignment " $bwa sampe  \ $hg19_ref \ $PWDS/fastq1.sai \ $PWDS/fastq2.sai \ $fastq_p...
  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-3 QC篇

    这步主要是判断一下NGS数据格式,以及做一些QC##############################################################  Step 1. check the quality score encoding#######...
  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-2 全局设置篇

    这步是全局设置,主要是Linux下,都以命令行形式,但如果每次都要把全路径打进去,会非常麻烦,因此都会把常用命令用简单的几个字母代表,比如hg19_ref="${tools_dir}/bwa-0.5.9/database/hg19/ucsc.hg19.fasta, 相当...
  • zjubell
    zjubell  的帖子被加了1分 23天前

    全外显子分析(WES)的一般步骤-1(科普版,大牛请绕道)

    其实很多步骤网上基本都有,现在生物信息学已经没有十年前那么神秘了,流程基本自动化,标准化分析一个全外显子,已经从十年前的几千块钱,狂跌至现在的几十块钱了。基本步骤包括这些:其中1是配置,2-11都是比对校正。12-14是统计,15是去除杂的中间产物,节省空间。16-18是call...
  • zjubell
    zjubell  发布了新帖 全外显子分析(WES)的一般步骤-6 过滤篇 24天前

    直接比对出来的结果非常乱,会有一堆假阳性,所以需要与金标准进行比对,同时去除一些低质量的背景噪音**注: REF,跟hg_ref是同一定义,有些地方我用的hg19_ref,有些地方我直接用REF,其实应该统一,我懒的改了。先发到这,看看有没感兴趣的,明天继续。##############################################################  Step 10. Filter out low quality mapping############################################################## use bamtools filter$bamtools filter -mapQuality &

关于我们|联系我们|版权声明|资格证书|丁香志|加盟丁香园|友情链接 丁香园旗下网站: 丁香园|丁香通| 人才|会议|药学|博客

Language Copyright © 2000-2018 DXY All Rights Reserved.
网站备案号:浙B2-20070219