收藏本站
《武汉大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

高通量数据的生物信息学分析和一致性排序算法研究

杨波  
【摘要】:在后基因组时代,利用生物信息学方法解决生物学问题越来越受到人们的重视。本论文主要研究生物学高通量数据的生物信息学分析,和一致性排序算法的开发。 在分子生物学和遗传学中,我们把发生在新生前体信使RNA转录本上的内含子移除同时外显子连接在一起的过程叫做RNA剪接。在这一过程中研究者们对U2AF异源二聚体,在前体信使RNA剪接过程中识别定义功能性的3’剪接位点的作用已经有很好的研究。但是依然有许多重要的问题不清楚,其中就包括最近在它们基因上刚发现的癌症相关的高频率突变位点是否有功能性作用。通过基因组范围的U2AF和RNA相互作用分析,我们发现在人类基因组中,U2AF能识别定义约88%的功能性3’剪接位点。同时在基因组其它位置也有大量的U2AF结合事件。通过全基因组数据分析和单基因实验验证,我们发现U2AF在内含子中的结合会抑制紧接着的下游3’剪接位点的剪接。在盒式外显子可变剪接事件中这表现为:U2AF结合在可变外显子上游会抑制可变外显子的剪接;U2AF结合在可变外显子下游会抑制下游组成型外显子的剪接进而促进与之竞争的可变外显子的剪接。基于我们的高质量高通量测序数据,利用最大熵机器学习方法,我们进一步建立一个U2AF65结合序列打分模型,可以用来预测U2AF65结合位点。用这一打分模型同样验证了我们前面提出的U2AF调控模型。这些发现揭示了U2AF在基因组范围的功能和调控机制,有助于我们进一步研究其相关疾病。 人们越来越意识到在大数据时代,对生物学数据排序很重要。然而对同一个问题,基于不同的数据和排序方法,通常会有很多不同的排序结果。Cohen-Boulakia研究组提出从这些不同的排序结果中生成一个一致性的排序。这样既可以突出这些不同排序结果中的相同的信息,同时可以最小化它们之间不一致的部分。所以这一方法可以有效的减少生物学数据中的噪声和错误。然而基于Kendall-tau距离,即使只有4不同的排序,生成一致性排序问题仍然是个NP难问题。在本文中,我们提出了一种新的Pivot算法,叫Consistent-Pivot算法。该算法采用了一种新的支点选择和其它元素分配方法。我们认为这一算法充分利用了一致性排序问题的数据特点。实验证明不论在运行时间还是准确度上,Consistent-Pivot算法都优于之前的Pivot算法。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:Q811.4

【相似文献】
中国期刊全文数据库 前10条
1 白雪源,陈香美,邱强;人肾高亲和力钠离子依赖性二羧酸转运蛋白基因的克隆和生物信息学分析[J];中国生物化学与分子生物学报;2002年04期
2 陈晓华;蔡国平;;人致肺纤维化相关因子的克隆和生物信息学分析[J];生物化学与生物物理进展;2006年07期
3 王锐;赵跃;张永云;李卫真;王淑燕;霍海龙;刘丽仙;苗永旺;霍金龙;;猪胰岛素样生长因子-Ⅰ的克隆及生物信息学分析[J];西南农业学报;2014年02期
4 谭从娥;王米渠;冯文哲;徐全壹;;生物信息学分析寒证海量数据的探索[J];中华中医药学刊;2008年12期
5 程勇前;成军;刘妍;王琳;徐东平;钟彦伟;曲建慧;赵平;;钙离子调节亲环素配体及其不同剪接体的克隆及生物信息学分析[J];医学研究生学报;2008年05期
6 卢雪梅;金小宝;朱家勇;沈娟;梅寒芳;马艳;肖明珠;褚夫江;;人溶菌酶基因的克隆和生物信息学分析[J];生物技术;2010年06期
7 牛伟涛;;家蚕中一未知基因的生物信息学分析[J];邢台学院学报;2011年02期
8 胡甘雨;司风玲;车燕飞;张玉娟;陈斌;;葱蝇过氧化氢酶基因的克隆及生物信息学分析[J];西南大学学报(自然科学版);2014年01期
9 杨向东,王仁,刘俊文,唐蔚青,李红霞,王抒;一个新的人突触相关蛋白基因的生物信息学分析[J];中国动脉硬化杂志;2004年01期
10 张艳宇,马平,陆一鸣,吕丽萍,姜升阳,周锡鹏,孙树汉,许金波;尖吻蝮蛇类凝血酶基因的克隆及生物信息学分析[J];中国实验血液学杂志;2005年04期
中国重要会议论文全文数据库 前10条
1 焦斐;阎萍;梁春年;郭宪;包鹏甲;裴杰;丁学智;褚敏;吴晓云;刘建;;牛FAS基因的生物信息学分析[A];中国畜牧兽医学会养牛学分会2011年学术研讨会论文集[C];2011年
2 唐爱发;余振东;桂耀庭;郭新;李贤新;周锦堂;朱辉;蔡志明;;SPACA4基因在人和小鼠的表达及其生物信息学分析[A];遗传学进步与人口健康高峰论坛论文集[C];2007年
3 刘惠君;谭宇蓉;刘持;向阳;屈飞;秦晓群;;BRS-3相互作用新基因的生物信息学分析及功能研究[A];湖南省生理科学会2008年度学术年会论文摘要汇编[C];2008年
4 黄浩;陆启轩;陈临溪;杨莉;毛小环;李兰芳;秦旭平;曹建刚;;APJ受体的生物信息学分析[A];全国第十二届生化与分子药理学学术会议论文集[C];2011年
5 陈大清;吴功庆;李亚男;;淹水胁迫下薏苡根系adh基因的克隆及其生物信息学分析[A];2005'海峡两岸植物生理与分子生物学教学研讨会论文集[C];2005年
6 田琪琳;施定基;贾晓会;王晓燕;黄希文;何培民;;真核藻PEPC的生物信息学分析[A];中国藻类学会第八次会员代表大会暨第十六次学术讨论会论文摘要集[C];2011年
7 陈玲;朱玲玲;史春梅;季晨博;郭锡熔;;miR-146b靶基因预测和生物信息学分析[A];2012年江浙沪儿科学术年会暨浙江省医学会儿科学分会学术年会、儿内科疾病诊治新进展国家级学习班论文汇编[C];2012年
8 苑赞;赵锦;刘孟军;;枣花粉过敏原Zizj1基因的克隆与生物信息学分析[A];第八届全国干果生产、科研进展学术研讨会论文集[C];2013年
9 王玲;高莲;李健;赖松家;;牛FoxO3基因的cDNA克隆及生物信息学分析[A];第五届中国畜牧科技论坛论文集[C];2011年
10 李婷;张英杰;刘月琴;李雪梅;李兰会;;反刍动物INHA基因编码区生物信息学分析[A];中国畜牧兽医学会养羊学分会2014年全国养羊生产与学术研讨会议论文集[C];2014年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026