CLC Genomics Workbench V7.5 版本发布

发布日期:2014年8月28日


新的特色和改进:

新工具:

New variant callers(Resequencing analysis):

在Resequencing analysis下面的Variant Detector工具栏中检测突变的三个新工具:Basic Variant Detection,Fixed Ploidy Variant Detection和Low Frequency Variant Detection。Basic Variant Detection和Fixed Ploidy Variant Detection是基于质量值和概率突变检出工具的完整实现,并提供了增强的筛选性能。 Low Frequency Variant Detection工具是基于统计检测低频突变如在混合组织的癌症或混合群体样本中存在的低频突变的工具。Quality-based和Probabilistic Variant Detection工具放在了工具栏中的“Legacy tools”中,最终将退役。

新的read mapper和下游抽样工具(NGS Core Tools):

新的内存性能高效的read mapper可在现代的笔记本上处理人类基因组数据。当read mapping重复使用相同的参考基因组时对参考序列索引文件进行缓存提升了速度。新的内存性能高效的read mapper取代了原有的“Map Reads to Reference”,但是仍保留了原有的名称。

新的“Sample Reads”工具可以用来抽取样本降低数据量进行全部的NGS分析。

新的ChIP-Seq工具(表观基因组分析)

在“Epigenomics Analysis”下的“ChIP-Seq Analysis”工具已经被插件“Peak Shape ChIP-Seq Analysis”(已经重命名为“ChIP-Seq Analysis”)代替。原来的“ChIP-Seq Analysis” 重命名为“ChIP-Seq Analysis(legacy)”并放到了新的“Legacy tools”文件夹下。新的ChIP-Seq Analysis工具使用新的方法鉴定显著丰度的read覆盖和有特征性状的read分布的基因组区段。算法的参数化通过从来自数据的信号的特征性状中学习自动完成,使该算法更智敏和容易理解。

Toolbox中添加了新的文件夹“Legacy tools”。“ChIP-Seq Analysis(legacy)”、Probabilistic Variant Detection和Quality Based Variant Detection工具都放在这里。

Workflows:

  • 输入内容现在显示在预览对话框中,也可以所有的格式输出。

  • 在Workflow中右击输入项的名称对其进行重命名。

  • 有多个参数需要输入的工具现在接受多个输入项。如Trio Analysis可以在相同的workflow中使用孩子、父亲和母亲的输入信息。

  • Workflow可以有多个输入项(这个可能将会降低batch的效用)。

  • 现在可在Workflow安装时直接绑定数据。这也就是说参考数据可以打包并通过Workflow共享(只推荐针对小数据)。

  • Workflow的输入项可以设定。如果不加锁定,运行时将采用默认设定。

  • 在侧边栏中添加了文本区。当搜索Workflow中的元素时,找到的元素将被放在视图中心并突出显示。

  • 新的编辑器添加到Workflow中来进行参数设置(configuration)

  • Workflow可以和插件一起打包并在插件安装时一起被安装。

  • 安装在Server上的Workflow在Workbench中有覆盖图标,容易和安装在Workbench上的Workflow进行区分。

  • Workbench和Server上的Workflow的运行是一致的,在日志、中间结果和输出命名上相同。

  • 为了在设定中清晰明了,当Workflow运行时Workflow向导中的锁定的设定项被默认地隐藏。当扩展开时,可见所有的参数。

  • Workflow中添加的新工具:Create Sequence Statistics。

蛋白分析,Pfam结构域查找:

Pfam Domain Search现在使用HMMER3和最新的Pfam数据库,可从“Download Pfam Database”中下载。

检索多序列时速度显著提升了。

在Pfam Domain Search中可以使用新的筛选工具,能产生和网上工具相同的结果。

菜单条上的本地搜索现在包括在“Path”上的过滤。

“Zoom tools redesign”:“Zoom to selection”现在也适用于序列、序列列表、比对和read mappings。

在track左侧显示track名称的tracks info侧边栏现在用隐藏的信息而非之前的滚动条显示。

针对表格的保存或应用侧边栏设定,现在支持共享相同列的不同的表格。

图形track现在可以输出成wiggle file,在wiggle输入时支持span选项。

“Filter Based on Overlap”和“Annotate with Overlap Infomation”现在接受表达值track作为输入。

SAM/BAM import。现在输入SAM或BAM文件时可以选择忽略没有比对上的reads。

Fisher’s Exact Test。增加了对p-value的校正,以对Fisher’s Exact Test进行多重检验,如Bonferroni correction和False Discovery Rate(FDR)。

加速:新创建的表达track的图形化显示更快速。

Copy操作现在可以中止。

“Reverse Translate”现在支持输出序列列表。

当输入Example Date和通过拖拽文件到Workbench和在Navigation area中止这些操作时将不再封堵用户界面。输入以后台过程运行,并可通过Processes标签栏进行监控。

CLC Workbench现在支持如Apple retina的高分辨率显示视图界面的所有数据(包括提示框)。

de novo assembler速率的小幅提升。


修正的错误:

  • Fisher Exact Test工具中导致错误计数的一个错误被修正了。Fisher Exact test算法现在检查case突变是否也存在于control突变中,即使是不同类型的突变(如SNV可以是MNV的一部分)。

  • 当查看单个track文件时在某些注释上右击不起作用的错误被修正了。

  • 现在在Workflow编辑器中进行放大或缩小,图标的改变一致。

  • Workflow编辑器中的validation显示上的问题被解决了。

  • Workflow参数设定向导中的一些错误更正了。之前决定哪些参数可用时不考虑输入项内容。

  • 在单独的read mapping编辑器中空格键不能引发“Find Conflict”操作的问题解决了。

  • 在单独的read mapping的溢出图(overflow graph)中不显示mismatch和insertion的问题解决了。

  • 由于临时文件名冲突导致de novo assembler和legacy read mapper崩溃的问题解决了。

  • 通过CLC Server运行NGS import工具现在可以工作了。


改变:

  • 为提高Workflow的稳定性:如果没有找到任何突变,将产生空的track文件,而非没有结果输出。

  • 因为升级到Java 7,Oracle将不再支持Windows Server 2003和OSX 10.5.8,10.6。因此,现在的系统要求是:Windows Vista,Windows 7,Windows 8,Windows Server 2008或者Mac OS X10.7或更新的版本。

  • 从2014年6月起,从COSMIC 下载数据需要注册。也就是从Download Genome Data工具中不再能下载COSMIC数据了。但您仍然可以登录到COSMIC网站,下载数据文件后通过Import Tracks工具输入到Workbench中。


兼容性:

  • 该版本可以和CLC Genomics Server 6.5一起使用。

  • 该版本使用的read mapping和de novo assembler对应于CLC Assembly Cell 4.3。

关注微信