分类筛选
分类筛选:

关于生物信息学论文范文资料 与生物信息学数据分析的计算机软件搭配有关论文参考文献

版权:原创标记原创 主题:生物信息学范文 科目:发表论文 2024-01-28

《生物信息学数据分析的计算机软件搭配》:本论文为您写生物信息学毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

摘 要:数据分析是生物信息学的核心,当前用于数据分析的生物信息学软件众多,但兼容性差.本文以分析研究Linux系统中的bowtie、samtools、g++及x11设计开发出生物信息数据分析高速高兼容性的可视化流程.其中bowtie用于生物数据比对,samtools用于数据的储存,g++用于权限环绕,x11用于可视化.

关键词:数据分析;数据比对;数据储存;可视化

生物信息学数据分析核心在于数据格式的转化、数据的储存及可视化.数据格式转化涉及数据比对,数据储存涉及将比对后的数据转储.在当前有较多软件用于数据分析的不同阶段.但是多数软件之间相互不兼容使做到数据分析繁琐冗杂.本文基于当前生物信息数据分析繁琐环节设计搭配出了一套兼容性强、分析速度快的流程.该流程可以为高校内各种中小型实验室服务.

1 比对软件安装

比对常用的工具有bowtie/bowtie2, BWA,SOAP1/SOAP2等.在转录组比对中,通常比对都会经历两部分问题,一部分是基因组比对,一部分是转录组比对.当比对是在基因组上比对时若物种为真核生物又要考虑是否是外显子还是内含子,如果是原核生物比对又要考虑重叠基因.在转录组比对上,这个问题又要考虑是mRNA比对还是小RNA比对.当比对产生碱基变化的时候要考虑是比对出错还是测序出错.所以在这个基础上将比对转化为数学上的函数映射问题,这部分问题可以采用以上方法解决.使用bowtie来map DNA测序,使用tophat来map RNA测序.实际上,tophat是通过调用bowtie来完成工作的.而tophat1和tophat2的差别最主要的就是调用了bowtie1还是bowtie2.Bowtie是一个超级快速的,较为节省内存的短序列拼接至模板基因组的工具.它在拼接35碱基长度的序列时,可以达到每小时2.5亿次的拼接速度.而该软件读取的读段长度相对较长,可以较好比对.

下载及配置方式

Wget http://downloads.sourceforge.net/project/bowtiebio/bowtie2/2.2.9/bowtie22.2.9linuxx86_64.zip?

r等于https%3A%2F%2Fsourceforge.net%2Fprojects%2Fbowtiebio%2Ffiles%2Fbowtie2%2F2.2.9%2F&ts等于1473729431&use_mirror等于nchc&unzip bowtie22.2.9linuxx86_64.zip cd bowtie22.2.9echo "PATH等于$PATH:/home/shuxue/soft/bowtie22.2.9/" >>

2 SAMtools安装

SAMtools是一个储存数据的工具,安装配置非常麻烦.首先需要安装编译很多前置包[2]

build static libraries

.../zlib1.2.1]# ./configure

.../zlib1.2.1]# make test

.../zlib1.2.1]# make instal

.../zlib1.2.1]# make clean

.../zlib1.2.1]# ./configure ——shared

.../zlib1.2.1]# make test

.../zlib1.2.1]# make install

.../zlib1.2.1]# cp zutil.h /usr/local/include

.../zlib1.2.1]# cp

tar jxf samtools1.5.tar.bz2

cd samtools1.5

echo "export PATH等于$PATH:/opt/biosoft/samtools1.5/bin" /etc/profile

cd ../ && rm rf samtools1.5 samtools1.5.tar.bz2

3 配置g++

對所有用户有效修改/etc/profile 对个人有效则修改~/.bashrc

在PATH中找到可执行文件程序的路径.sudo export PATH 等于$PATH:$HOME/usr/bin

gcc找到头文件的路径

sudo export PATH等于/usr/contain/libxmlsnvown2:/Mysqlsi export C_contain_PATH

sudo export PATH等于export C_contain_PATH/usr//contain/libxmlsnvownPLUS_contain_PATH

动态链接库的路径

C_contain_PATH/usr//contain/libxmlsnvownPLUS_contain_PATH source bashrc

#找到静态库的路径 LIBRARY_PATH等于$LIBRARY_PATH:/Mysqlsi export LIBRARY_PATH

使用source,可以将修改的bashrc更改,或者重启.[3]生成文件的依赖关系,比如:g++ MM;在屏幕上可以展示两者的动态相关性,根据动态相关性设置重定向;[4]MM无法在重定向时期检查Shell语法的正确性,所以需要注意重定向期间语法和路径的正确性.

4 X11的安装

Linux是基于命令操作的操作系统,同windows不同,windows是图形可视化界面系统.根据两者系统的不同.惯于使用windows系统的用户在转入Linux系统时非常不熟悉.需要使用X11来过渡.简言之,X11是将命令格式的操作空间变为可视化的操作空间.综合X11下,Linux系统中的bwa/bowtie等软件也可以被X11间接可视化,所以X11的安装是新用户使用Linux系统的重要关键部分之一.不过,X11与Windows的可视化界面不同,这种不同类似于windows的DOS环境与Linux环境的终端不同.不同之处在于Windows离开DOS后可以继续使用,而Linux不能离开终端,也不能完全离开可视化.[5].

生物信息学论文参考资料:

医学信息学杂志

生物信息学论文

中华医院感染学杂志

电子信息工程毕业论文

新课程导学期刊

移动信息期刊

结论:生物信息学数据分析的计算机软件搭配为大学硕士与本科生物信息学毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写生物信息学方面论文范文。

和你相关的