med_paper_0002 摘要 介绍 结果

杂志: nature genetics

IF :27.959

单位 :Department of Computer Science, Brown University, Providence, Rhode Island,USA

作者 : Mark D M Leiserson

摘要

  • 肿瘤导致很多的变异,长尾效应导致发现显著的基因和通路比较困难。
  • 对3281个样品,12个癌种,进行pan-cancer的分析,使用HotNet2软件。该软件克服了只能研究单个基因、单个通路和网络的问题。
  • 得到了16个显著的子网络,包括了常见的信号通路和 不常见的信号通路,例如凝聚素(cohesin),凝血酶(condensin)等。很多网络都有共发生的情况出现。
  • 这些网络包含了很多低频突变,已经确认在肿瘤中有作用。
  • 通过pan-cancer network分析,可以提供更新的治疗思路

介绍

  1. 肿瘤突变的长尾效应:对此的解释是 突变的基因影响,多个信号通路和调控通路以及蛋白复合物一起发挥作用。
  2. 目前对基因的通路分析存在问题
    • 没有计算显著性
    • 没有鉴定出新通路
    • power不够
    • 忽略了基因间的拓扑结构
  3. 开发了HotNet2,用于从全基因组的互作网络中发现突变的子网络。使用了 directed heat diffusion model(定向热扩散模型),评估单个基因中突变的显著性,同时考虑蛋白间的互作。
  4. 发现了16个显著的子网络。很多其中的低频突变同已知的癌症相关基因进行互作,表明这些跟癌症有作用。
  5. 高频突变是 山峰(moutains),低频是山丘(hills)

结果

利用HotNet2鉴定显著的突变子网络

  • 数据:
    • 外显子数据,array CGH,RNAseq
    • 总共3281个样品,12个癌种,19424个转录本,去除超突变的样品和去除在所有样品低表达的基因,得到11565个突变的基因。
    • 使用突变的频率作为heat,使用三个不同的互作网络,利用HotNet2来鉴定显著的subnetwork
  • 结果
    • 每个基因中在群体中,发生突变样品数的数量级有很大区别,尤其是那种超高表达的基因的存在,这样会导致HotNet1算法中出现问题。
    • HotNet2考虑了方向性,所以能够比较好的避免该问题。
    • 合并所有结果,得到了16个子网络,包括condensin复合物和CLASP&CLIP蛋白网络,鉴定了13个linker蛋白,出现在多个子网络中。
    • 这些网络包括常见的癌症通路:
      • TP53
      • PI3K
      • NOTCH
      • RTK信号通路
    • 研究子网络在不同肿瘤类型中的富集性。
    • 发现了许多novel driver gene
    • 研究富集基因是否 有过多的失活突变,或者用NMC对编码的蛋白序列,iPAC对蛋白结构,检查missense突变的cluster性

子网络中的突变共发生和互斥发生的情况

BAP1复合物和互作

*