口腔鳞状细胞癌和癌旁组织的基因表达分析
[摘要]目的 利用来自美国国立生物信息技术中心(NCBI)基因表达数据库(GEO)的基因芯片数据,分析基因在口腔鳞状细胞癌(OSCC)中癌和癌旁组织的差异表达情况,为寻找癌和癌旁组织双边的抑癌靶标提供依据。
方法 选取来自NCBI—GEO数据库中OSCC患者的癌和癌旁组织,以及正常人口腔组织的基因芯片数据,分别计算得到前两者相对后者的差异表达基因,并进行功能聚类与特定基因的通路分析。
结果 大部分差异基因为癌与癌旁所共有,其中多数基因的差异表达方向在两者中一致,少部分方向不一致。
这种差异表达行为的不同与基因的功能相关,因此,差异表达行为可能为抑癌靶标的发现提供线索。
结论 基因在癌和癌旁组织中的差异表达行为与基因的功能相关,具有特定差异表达行为的基因可能成为潜在的抑癌靶标。
毕业论文网 [关键词]口腔鳞状细胞癌;双边药物靶标;功能聚类 [中图分类号]R782 [文献标志码]A [doi]10.7518/gjkg.2015.03.016 肿瘤的发生与发展不仅依赖肿瘤本身,还需要与肿瘤周边组织的相互作用。
近年来的研究提出了双边扰动治疗方案的概念,同时对肿瘤与其周边组织中的靶标进行扰动,以达到抑制癌细胞生长的目的。
本文以口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)为例,通过分析癌和癌旁双边组织中基因表达的情况,试图为寻找双边抑癌靶标提供线索。
1.材料和方法 1.1数据提取 在美国国立生物信息技术中心(national center for biotechnology information,NCBI)基因表达(gene expression omnibus,GEO)中以“oralcancer”为关键词,限定范围为“人类”和“基于芯片的表达谱数据”搜索数据集,并根据组织类型将数据集分为3类:OSCC患者癌组织数据、OSCC患者癌旁组织数据、正常人口腔黏膜组织数据。
为了使数据具有可比性,所有数据均使用同一个芯片平台(Affymetrix人类基因组芯片U133Plus 2.0型)。
其中,斯坦福大学癌症中心提供的系列号为GSE42743数据集中24对OSCC患者的癌上皮数据和癌旁正常黏膜数据被纳入2个试验组。
这些癌症患者的组织均来自美国德克萨斯州立大学安德生肿瘤中心头颈癌库。
而Fred Hutchinson癌症研究中心提供的系列号为GSE30784数据集中的45个正常口腔组织数据则作为对照组。
这些正常口腔组织来自于在2003年12月1日至2007年4月17日之间,在华盛顿大学医学中心、港景医疗中心以及西雅图的弗吉尼亚州普吉特海湾康复系统3所机构中,接受扁桃体切除术或针对其他非癌症疾病(例如阻塞性睡眠呼吸暂停综合征)的口腔手术患者。
所有患者均满18周岁并可用英语交流。
1.2数据处理与分析方法 2个试验组和对照组分别被分为“癌组织相对正常组织”和“癌旁组织相对正常组织”2组数据进行基因差异表达分析。
其中,基因芯片数据的预处理和差异表达分析均使用了Bioconduetor相关软件包与算法。
差异表达分析的结果为试验组相对于对照组的基因表达变化倍数的对数值(logFC)。
为了研究基因同时在癌组织和癌旁组织中相对正常组织的差异表达行为(上调/不变/下调),对2组数据共有的差异表达基因,根据其差异表达的方向(即logFC值的正负)分为“下—上”、“上—下”、“下—下”、“上—上”4组。
其中,第一个方向为基因在癌组织中相对正常组织的差异表达变化,第二个方向为基因在癌旁组织中相对正常组织的差异表达变化。
使用基因功能聚类分析网站Panther(对以上4组不同差异表达行为的基因以及所有的差异表达基因进行聚类分析,查看差异表达的基因分别属于哪些功能分类。
同时,使用基因注释网站NCBI Gene(和基因通路网站KEGGpathway(对其中的一些基因进行进一步的分析,考察其功能及参与的信号通路。
2.结果 2.1差异表达分析与差异表达行为分组 癌组和癌旁组相对于正常对照组进行的差异表达分析结果显示,不论是癌还是癌旁,其基因表达情况与正常人的细胞相比均发生了很大的变化,并且多数差异表达基因是癌和癌旁所共有的。
根据这些差异表达基因的logFC数值和调整后的置信度(adjusted P value)进行筛选,得到置信度较高的差异表达基因集合。
根据差异表达基因分别在癌和癌旁中的差异表达方向,可以得到4组不同的差异表达基因,详见表1。
2.2不同差异表达行为基因的功能聚类 使用Panther,对以上4组具有不同差异表达行为的基因分别根据其分子功能、细胞定位、参与的生物学过程等3个方面进行功能聚类。
通过对各组的聚类结果进行比较,可以发现差异表达基因的行为与其功能存在明显相关。
例如,在“下一上”差异表达组中,基因产物定位于细胞外的比例明显高于其他组;在“下—下”差异表达组中,基因产物定位于细胞内的比例明显高于其他组;另外,在“下一上”组中,完全不存在蛋白质复合体(基因语义注释ID为GO:0043234),核糖核蛋白复合体(GO:0030529)以及质膜(GO:0005886)类型的基因,而其他3组都或多或少具有这3个类型。
2.3对“下—上”组WIFI基因的分析 以上结果显示:癌与癌旁共同差异表达基因的差异表达行为与其功能具有相关性。
考虑到“癌与癌旁在某些生理代谢机能上存在分工合作,癌旁对于癌具有重要的支持作用”的猜想,在癌中表达下调的基因,可能通过在癌旁中表达上调并能分泌到胞外的基因进行补充。
因此,接下来笔者对“下—上”组(即在癌中下调、在癌旁上调)中定位于细胞外的基因进行了分析。
由于这个分组中的基因数依然较多,因此,笔者根据这些差异表达基因的差异表达程度(即logFC值)再次进行了筛选。
选取了最显著的12个基因,依次为WNT抑制因子1(WNT inhibitory factor 1,WIFl)、天冬酰转移酶(aspartoacylase,ASPA)、生长激素受体(growth hormone receptor,GHR)、包含黄素的单加氧酶2(无功能)[flavincontaining monooxygenase 2(non—functional),FMO2]、过氧化物酶体增殖物激活受体丫共激活子a(peroxisome proliferator—activated receptor gamma,coactivatorl alpha,PPARGClA)、芳乙酰胺去乙酰酶类似物2(arylacetamide deacetylaselike 2,AADACL2)、血管生成素类似物1(angiopoietin—like 1,ANGPTLl)、溶解载体家族47(多药物与毒素挤压)成员1[solute carrier family47(multidrug and toxin extrusion)member 1,SLC47A11、单胺氧化酶B(monoamine oxidase B,MAOB)、跨膜蛋白100(transmembrane protein 100,TMEMl00)、磷酸烯醇丙酮酸羧激酶1(可溶)[phosphoenolpyruvate carboxykinase1(soluble),PCKl]、包含DEP结构域的雷帕霉素作用靶标相互作用蛋白(DEP domain containingmTOR—interacting protein,DEPTOR)。
使用NCBI Gene对以上12个基因进行查找。
其中,AADACL2、ANGPTLl、SLC47A1、TMEMl00、PCKl、DEPTOR这6个基因因为尚没有具体功能的注释而被排除。
MAOB、ASPA、FM02、PPARGClA这4个基因,其编码的蛋白定位在细胞内,理论上这类基因无法直接促成不同组织间细胞的相互作用。
GHR基因编码的蛋白为生长激素受体,但logFC数据显示,其在癌细胞中的差异变化相对较小。
WIFI基因一方面编码胞外分泌蛋白,具有促成癌和癌旁细胞间相互作用的可能,另一方面,其差异表达程度也最显著。
因此,笔者最终选择WIFl基因进行更深入的分析。
根据NCBI基因注释的信息可知,WIFl是蛋白质编码基因,属于抑癌基因,产物为果蝇无翅基因(wingless gene,WNT)抑制因子1,是一种分泌蛋白,在细胞外行使信号分子的功能。
WNT抑制因子1包含1个WNT抑制因子结构域和5个类表皮生长因子结构域,可以与WNT结合并抑制后者的功能,进而抑制整个经典WNT信号通路。
WNT是一个分泌信号蛋白的家族,在人体内包含19个成员,在进化中高度保守,参与多种发育进程,包括细胞命运与细胞周期的调控,属于原癌基因。
WIFl基因被发现在多种癌症中表达下调,如在食管鳞状细胞癌和子宫鳞状细胞癌中,WIFl基因被表观失活。
从上述OSCC中基因差异表达分析的结果来看,WIFl虽然在癌中下调,但在癌旁中上调,并且上调倍数比下调倍数高。
由于WIFl为分泌型信号蛋白,通常情况下可以认为在患者口腔癌旁的数量应该比癌中的数量要多,因此可以推测癌旁WIFl的水平不仅没有减少,反而应该是增加的。
在差异表达的基因中搜索WNT家族的所有基因,其差异表达情况详见表2。
从表2中可以看到,WNT家族各个基因的差异表达情况在癌和癌旁组织中基本一致,都是以相近的幅度同时上调或同时下调。
WNT家族的表达变化总体来说要明显高于WIFl。
按照两者间蛋白质相互作用的关系,两者的结合比例为1:1,即至少从转录层面的数量来讲,WIFl可能无法对WNT进行完全抑制。
2.4考察其他抑制WNT通路基因的表达情况 表3列举了其他一些与WIFl类似的、对WNT家族蛋白起抑制性作用的蛋白或家族,可以看到,它们在癌和癌旁中也有上调的趋势。
这说明至少在癌旁,起抑制癌生长作用的WIFl却表达上调的情况并不是特例。
3.讨论 3.1癌旁组织的差异表达基因可以为寻找抑癌靶标提供线索 本研究显示:在癌症患者体内,即使是癌组织周围表型正常的组织,实际上也存在很多相对正常人组织差异表达的基因。
笔者有理由相信,这些在癌旁组织中差异表达的基因构成了癌旁组织对癌组织的支持。
因此,在寻找抑癌靶标的时候,有必要同时考察基因在癌和癌旁组织中分别的变化情况。
3.2癌旁组织对癌组织作用的双面性 一般认为,癌旁组织对癌组织的生长应该起到促进作用的,因此,笔者最初期望找到一些由癌旁分泌,作用于癌,对癌细胞生长起到促进作用的基因。
本研究中关注的WIFl刚好和预期相反。
这种本身对WNT通路起抑制作用的抑癌基因,虽然在癌中表达下调,却在癌旁组织中表达上调。
通过对WNT通路其他抑制性基因的考察发现,WNT基因的这种行为并不是特例。
因此,可以认为以单个基因的角度来说,癌旁组织对癌组织的作用是具有双面性的。
即一部分基因的表达变化起抑制癌组织生长的作用,另一部分则起促进作用。
3.3寻找双边抑癌靶标组合需要更深入的分析 本研究中关注的WIFl基因,虽然在癌旁组织中上调,但却没有能够有效地抑制癌细胞的生长,可能是因为WNT家族基因表达的上调更高,也可能是有其他促进生长的通路得到上调,掩盖了WIFl上调抑制WNT通路的作用。
即使WIFl在差异表达上具有较高的显著性,也不能确定其是一个有效的抑癌靶标。
因此,与本文相关的工作接下来可能需要更多地关注其他组别的基因。
例如,在“上—下”组的基因中,可能存在癌中上调,作用于癌旁,使癌旁中对癌生长起抑制作用的基因被抑制的基因。
通过本文的分析,可以看到,癌和癌旁组织之间可能存在着复杂的相互作用,参与这些相互作用的基因可能是潜在的抑癌靶标,通过整合分析癌和癌旁组织的各种实验数据,才有可能发现并筛选出潜在的抑癌靶标组合。