
杂志: nature genetics
IF :27.959
单位 :Department of Computer Science, Brown University, Providence, Rhode Island,USA
作者 : Mark D M Leiserson
摘要
- 肿瘤导致很多的变异,长尾效应导致发现显著的基因和通路比较困难。
- 对3281个样品,12个癌种,进行pan-cancer的分析,使用HotNet2软件。该软件克服了只能研究单个基因、单个通路和网络的问题。
- 得到了16个显著的子网络,包括了常见的信号通路和 不常见的信号通路,例如凝聚素(cohesin),凝血酶(condensin)等。很多网络都有共发生的情况出现。
- 这些网络包含了很多低频突变,已经确认在肿瘤中有作用。
- 通过pan-cancer network分析,可以提供更新的治疗思路
介绍
- 肿瘤突变的长尾效应:对此的解释是 突变的基因影响,多个信号通路和调控通路以及蛋白复合物一起发挥作用。
- 目前对基因的通路分析存在问题
- 没有计算显著性
- 没有鉴定出新通路
- power不够
- 忽略了基因间的拓扑结构
- 开发了HotNet2,用于从全基因组的互作网络中发现突变的子网络。使用了 directed heat diffusion model(定向热扩散模型),评估单个基因中突变的显著性,同时考虑蛋白间的互作。
- 发现了16个显著的子网络。很多其中的低频突变同已知的癌症相关基因进行互作,表明这些跟癌症有作用。
- 高频突变是 山峰(moutains),低频是山丘(hills)
结果
利用HotNet2鉴定显著的突变子网络
- 数据:
- 外显子数据,array CGH,RNAseq
- 总共3281个样品,12个癌种,19424个转录本,去除超突变的样品和去除在所有样品低表达的基因,得到11565个突变的基因。
- 使用突变的频率作为heat,使用三个不同的互作网络,利用HotNet2来鉴定显著的subnetwork
- 结果
- 每个基因中在群体中,发生突变样品数的数量级有很大区别,尤其是那种超高表达的基因的存在,这样会导致HotNet1算法中出现问题。
- HotNet2考虑了方向性,所以能够比较好的避免该问题。
- 合并所有结果,得到了16个子网络,包括condensin复合物和CLASP&CLIP蛋白网络,鉴定了13个linker蛋白,出现在多个子网络中。
- 这些网络包括常见的癌症通路:
- TP53
- PI3K
- NOTCH
- RTK信号通路
- 研究子网络在不同肿瘤类型中的富集性。
- 发现了许多novel driver gene
- 研究富集基因是否 有过多的失活突变,或者用NMC对编码的蛋白序列,iPAC对蛋白结构,检查missense突变的cluster性
子网络中的突变共发生和互斥发生的情况
- 有四对子网络共发生: TP53和NOTCH,TP53和RTK,PI3K和cohesin complex,PI3K和ASCOM
- 互斥发生的突变一般位于同一个通路中
TP53、PIK3CA和NOTCH网络
- 三大肿瘤相关子网络,中间有很多linker基因,表明通路间通信很多。
- HotNet2同时能鉴定出通路中新的基因,这些基因同已知的癌症相关,但是突变频率很低,同时在single gene test中不够显著。
SWI/SNF complex
- 鉴定复合物在肿瘤中的频率,同时发现新的基因ADNP
BAP1复合物和互作
*




近期评论