• IPA - Core Analysis 结果解读

IPA - Core Analysis 结果解读

IPA Core Analysis 教程 概述Core Analysis 会自动调用来自QIAGEN Knowledge Base总结的文献信息,将组学数据中的分子放到已有的生物学发现中,从而帮助您获取多方位的生物学解释。本教程,我们以转录组学数据分析为例。分析报告一般分为:Summary - 列出所有分析结果中的最主要结果;Canonical Pathway - 发

IPA Core Analysis 教程案例

 概述

Core Analysis 会自动调用来自QIAGEN Knowledge Base总结的文献信息,将组学数据中的分子放到已有的生物学发现中,从而帮助您获取多方位的生物学解释。本教程,我们以转录组学数据分析为例。

分析报告一般分为:Summary - 列出所有分析结果中的最主要结果;Canonical Pathway - 发生显著变化的信号通路或者代谢通路,类似于KEGG分析;Upstream Analysis - 预测组学数据中分子的表达值变化是由哪些调控因子引起的,以及这些调控因子是被激活了还是被抑制了,IPA中的调控因子指的是可以影响其他分子转录或表达的任一分子;Diseases & Functions - 列出组学数据中表达值发生变化的分子会与哪些已知疾病或者生物学过程相关;Regulator Effects - 依据组学数据提出假设,上游调控因子的激活或者抑制如何导致了下游表型、生物学功能或者疾病的产生/发生;Networks - 基于QIAGEN Knowledge Base,自动绘制的一些无方向性的分子互作网络。注:本教程仅介绍IPA部分功能的使用。

 

数据

分别在哮喘加重期和康复期获取儿童白细胞做RNA microarray 分析,本案例的演示数据源于文献PMID 19620293,为PBMCs(外周血单核细胞)的基因表达值。目的是从这些数据中探究急性哮喘病发生时,免疫/炎症反应是否(以及如何)参与了此过程。另外,找寻新的基因到疾病的关联,希望可用于后续的实验验证。

 

任务

1.       打开芯片数据的Core Analysis结果。

2.       阅读Summary,快速确定可能的探索方向。

3.       探索与我们的研究方向相关的结果:查看Canonical Pathways,这里面有显著发生变化的基因;使用MAP (Molecule Activity Predictor)工具,预测最终某条通路的末端功能影响;Overlay Biomarkers,找出TREM1信号通路的的哪些基因同样也是哮喘病治疗疗效的有效指示分子(efficacy marker);探索下游调控效应,对疾病和生物功能有什么影响(diseases and functions);查看Regulator Effects提出的假设,某些上游调控因子的激活或者抑制是如何导致了像哮喘病这样的结果。

 

步骤

1.  启动IPA

2.  在左边的Project Manager中,双击:My Projects > Example Analyses > Analyses > Childhood exacerbated asthma GSE16032,会打开分析结果,首先是Summary部分。

1489498726496586.pngSummary Tab

Summary中,可以查看所有不同分析类型的主要结果。对于本数据:一些免疫相关的通路参与到了哮喘病中,比如TREM1信号通路和炎症体通路;关键的细胞因子被激活了,比如IL4IFNA8;传染病(Infectious Disease)、呼吸道疾病(Respiratory Disease)和炎症反应(Inflammatory Response)等生物学过程参与了哮喘病加重;调控效应网络(Regulator Effects networks)表明一些上游调控因子可能导致了粒细胞(granulocytes)的累积和中性粒细胞(neutrophils)的激活;发现一些互作网络(Interaction networks)参与了细胞周期(cell cycle)和机体损伤(organismal injury)等生物学过程。

分析结果中的P值以红点展示,集合的结果为每个亚集合的P值。

注:由于QIAGEN Knowledge Base数据库是每周更新的,同一数据在不同时间的分析结果可能不会完全一致。

 

Canonical Pathways tab

3.       单击Canonical Pathways页,Canonical Pathways会依据文献中记载的信息给出细胞内的信号传递和代谢级联反应是如何发生变化的。基于我们的转录组数据,TREM1 Signaling pathway被预测为是被激活的(橙色柱形条)。TREM1是一个重要的细胞表面信号分子,参与了免疫炎症反应。单击这个橙色柱形条,可以展示TREM1 Signaling pathway中相关分子的结果。

上面的柱形图(upper pane),柱子的高度表示数据集中的分子与QIAGEN Knowledge Base所记录的这条Pathway中的所有分子的重叠(overlap)显著性,P值的计算基于Fisher右尾精确检验(Fisher’s right tailed exact test),并进行了-log(p-value)换算,也就是Y轴的坐标值。柱子越高,说明数据集中的分子和Pathway中的分子重叠(overlap)的越多。柱子的颜色表示这条通路是被预测为被激活了(橙色)还是被抑制了(蓝色)。

1489498716638118.png下面的表格(lower pane)展示了数据集中那些位于TREM1 pathway中的分子(单击柱形图中的Pathway可进行切换)。注意,一些来自数据集的基因可能会隐藏于Pathway中的分子组或者复合体中。

1489498717910122.png表格中的信息:Gene Symbol Entrez Gene name;上传时数据识别基因所用的探针(identifier);数据集中实际观测到的基因表达值变化,如log ratio p-value;通路中分子期望的上下调方向;分子的细胞定位和分子类型;如果该分子是一个Biomarker,会给出该Biomarker的类型(diagnosis, efficacy等),这有助于判定已知的该分子所参与的疾病,是否和你现在正研究的疾病相关;分子的靶标药物信息。

如果窗口(pane)太小,可拖拽垂直分界线进行调整。

4.  点击下表右上方的Open Pathway按钮,打开该Pathway的简图。

Canonical pathway一般都是有方向性的,在细胞中伴随着特定的生物学流程。箭头以及从上往下的流程都分别指明了上下游的定位。

数据集中通过了过滤条件的分子,会分别以红色或者绿色表示上调或者下调;数据集中没有通过过滤条件的分子,在Pathway中会着以灰色;数据集中没出现的分子,显示为白色。

分子的形状和位置分别表示该分子的基因类型和细胞定位。

有双层边缘线的代表它是一个分子组(通常是蛋白家族)。分子组可以是多个颜色的,表示它的成员既有上调的分子,也有下调的分子。右键该分子组,选择"Show Members/Membership"可以查看组内的每个分子。

这条Pathway展示了TREM1 pathway的激活情况,发现在哮喘发生时,不仅一些关键的受体发生了上调,一些下游的效应分子也发生了上调。

1489498719445206.png

5.      为了获取Pathway中更多的生物学因果调控结果,可以通过Overlay > MAP (Molecule Activity Predictor)工具进行预测。

1489498717134349.png

MAP可以依据文献信息预测通路中节点(分子)的活性,而不是依据你的数据集中检测到的上下调。MAP会尽可能为Pathway中那些白色或者灰色的分子进行着色(橙色上调,蓝色下调),而这是依据那些满足过滤条件的分子(也就是Pathway中的那些红色分子或者绿色分子)的调控效应而预测的。比如说,你的数据集中的某个基因发生了上调,并且有文献声明它可以激活一个下游的基因,那么下游的基因就会被预测为是被激活的。橙色的节点表示预测为激活,蓝色的节点表示预测为抑制。

1489498721735542.png

放大Pathway的底部部分,你可以打看到一些和免疫相关的生物学过程是被预测为上调的(激活的)。比如适应性免疫(adaptive immune responses)、固有免疫(innate immune responses)和促炎反应(proinflammatory response)都被预测为是上调的。

1489498718793463.png6.      双击Pathway中的任一一条关系线,都可以打开对应的文献证据,比如双击TNAa分子和促炎反应(Proinflammatory response)之间的连线,可以打开如下的一个总结(Summary:

1489498720136617.png

如果你需要,可以单击左边蓝色的文献超链接,会跳转到NCBI对这篇文章的报道页面上。

7.      单击Pathway工具条上的Scroll icon会打开一个链接,该页面记载了关于这条Pathway的文献报道。

1489498720374763.png

这个Pathway报告,讨论了TREM1 pathway在免疫功能中扮演的角色,并展示了通路中的一些蛋白是哮喘药物试验的靶标分子。

1489498722111688.png8.      叠加标志物(Overlay biomarkers),判定TREM1 Signaling pathway的基因中是否有已知的哮喘标志物。方法:Overlay > Biomarkers。注意,这些已知的Biomarkers的排序仅简单地以与所给定通路中重叠的Biomarker分子数多少进行排序。很明显,TREM1 pathway中充满了哮喘病的Markersasthma markers),通路中有28个分子是已知的哮喘病功效(efficacyBiomarkers

1489498722239342.png勾选Asthma这一行Biomarkers,所有与哮喘相关的Biomarkers都会在通路图中以连线形式进行标出,双击任一Biomarker的标签或者连线都会打开对应的文献证据。

Upstream Regulators

9.      单击Upstream Analysis,可以查看是哪些上游调控因子通过被激活还是抑制,导致了我们数据集中分子的表达变化。

1489498722603477.png单击Activation z-score,对调控因子进行排序,然后对上游调控因子的分子类型进行过滤,仅保留分子类型为"Genes, RNAs, and Proteins"的调控因子。选择第一行的调控因子-TGM2,单击上方的“Display as Network”按钮。

1489498723722761.png

这里会以圆圈图来展示调控因子(中心)和它的靶标分子(外环),调控因子的激活预测来源于它的靶标分子的表达值变化。

你也可以改变这个网络图的显示方式,单击工具栏中的1489498723108659.png,选择以“Subcellular”方式展示,你可以看到TGM2是一个胞质蛋白,他可以调控一些胞外蛋白和膜上蛋白的表达。

1489498726666863.png你也可以通过这个网络图去调研分子和疾病&功能的关系。单击“Build”按钮,选择“Grow”,单击“Disease & Function”按钮,IPA会计算P值(Fisher's exact p-value),评估网络中分子与所有疾病&功能的关联性。

1489498726123832.png很明显,有重叠的(有关联的)疾病&功能都与免疫紊乱和炎症病变有关。你可以把疾病或者功能添加到右边的网络图中,比如图中所示的系统性自身免疫综合征(systemic autoimmune syndrome),这说明哮喘病情的加重和这些参与系统性自身免疫综合征的分子有关系。你也可使用表格右上角的“Add/Remove columns”选项,来获取更多的信息。你还可以对列表进行筛选:

1489498723178667.png

如图,你会找到一些列其它上游调控因子,这些调控因子和哮喘病有直接关联,比如NR3C1 IL4,但也会有其它一些调控因子,尚未并未发现与哮喘有关,需要进一步的探究,可参考后面的调控效应分析(Regulator Effects analysis)。

Downstream Effects

10.   单击“Diseases and Functions”选项,基于数据集中差异表达的基因,预测对疾病和生物学功能的影响。

下面这个树图(Treemap)是由一个个小的方块组成,每个方块代表着由IPA总结的功能集合,大集合下面又分亚集合,从这个图中,很容易可以查看每个功能的方向趋势,红色表示为增强(上升),蓝色表示减弱(下降)。

从这个视图中,可以发现许多位于免疫细胞运输(Immune Cell Trafficking)、炎症反应(Inflammatory Response)和许多其他功能集合的下面的亚集合被预测为是上升的,你可能会猜想参与免疫反应的这些细胞是不是也参与了哮喘。

1489498724582564.png你还可以进一步探索,比如打开某一你感兴趣的功能,可以查看相关的基因,或者去查看支持这一功能受到影响的文献证据。

Regulator Effects

11.   调控效应(Regulator Effects)会提出一些假设,关于上游调控因子是如何导致了下游的生物学现象,比如哮喘病。打开:“Regulator Effects”选项页,在“Diseases & Functions”这一列中筛选“asthma”,如图:

1489498724812698.png单击做左边蓝色ID号,可以查看该网络(Network)。

1489498725473220.png在这个假设(Network)中,最上面的5个上游调控因子被预测为是被激活的状态,并且调控了下游靶标基因的表达(中间部分的分子),而其中的部分靶标分子可能导致了哮喘病(最下面)。有趣的是,目前尚未发现任何一个上游调控因子与哮喘直接相关,否则,会有一条连线直接把上游调控因子和哮喘相连。若想探索更多网络中基因的详情,可双击节点(node),比如DPP4DPP4是该Network中的一个上游调控因子。

12.   从“Gene View”中,获取某个基因的更多信息。双击DPP4,会打开该分子的Summary

1489498725605500.png

在“Molecule Summary”的顶部,单击DPP4(蓝色,表示有超链接),会在浏览器中打开DPP4基因的详细介绍,比如说转录本、剪切类型和一些文献证据等等。通过查看DPP4的介绍,发现该分子与一些免疫细胞功能相关。有趣的是,看一些IPA没有收录的一些低知名度文献,发现一些证据支持DPP4是一个哮喘病人呼吸道炎症的Biomarker。所以,尽管本研究用的样本是人外周皿淋巴细胞,IPA还是可以指出DPP4可能在哮喘病人的呼吸道系统中扮演某些角色。


总结

Summary部分,数据集中哪些表达值发生改变的分子(受影响的分子)参与了炎症反应和免疫相关的信号通路。

Canonical Pathways结果,在TREM1 pathway中探索那些受影响的基因,哪些与哮喘有关。Overlay结果显示许多TREM1 pathway中的许多基因本身就是哮喘治疗疗效的标志物(Biomarker)。

Downstream Effects结果显示,免疫细胞及其功能被激活,比如细胞间的信号传导、胞内运输(cellular trafficking)和细胞运动等。

Regulator Effects提出假设,这些调控因子是如何导致了哮喘病。本文发现了一个Knowledge Base中尚未记载的调控因子,该分子还未发现与和哮喘有直接关联。


如果您对软件感兴趣,欢迎加入IPA的QQ学习交流群:475878928。


关注微信