淡水氤氳
1、具有將強(qiáng)的編程能力,具有一定的生物專業(yè)背景2、熟悉Perl、R、Python(數(shù)據(jù)分析)、php+mysql(數(shù)據(jù)庫(kù))、html、css(網(wǎng)頁(yè))、c、c++、c#、java任意語(yǔ)言或其他編程語(yǔ)言,能熟練進(jìn)行網(wǎng)絡(luò)和界面編程;3、具有數(shù)據(jù)庫(kù)開(kāi)發(fā)經(jīng)驗(yàn);熟悉Linux系統(tǒng)者;開(kāi)發(fā)過(guò)生物信息學(xué)軟件;具有二代測(cè)序數(shù)據(jù)分析經(jīng)驗(yàn)的;4、具備熟練的英文閱讀、溝通以及寫作能力;有較強(qiáng)的自主學(xué)習(xí)能力,
守望的夜
首先你得思路清晰其次你得會(huì)各種軟件和數(shù)據(jù)庫(kù)查找,例如Perl、Python等如果都不會(huì),又想做這行,要么回爐重造,要么找個(gè)靠譜的培訓(xùn)班學(xué)習(xí)學(xué)習(xí),實(shí)在都不行,勸你不要跳坑了,把自己會(huì)的變成自己喜歡的,繼續(xù)奮斗
非人勿擾的2016
1.編程
Linux:會(huì)用Editor(. VIM) 和 Shell Script (. bash);推薦《鳥(niǎo)哥的Linux私房菜-基礎(chǔ)學(xué)習(xí)篇》
Python/Perl:《Python編程入門(第3版)》,Perl推薦小駱駝
R/MATLAB:《R語(yǔ)言實(shí)戰(zhàn)(R in action)》
如果做數(shù)據(jù)庫(kù)或者server,推薦再學(xué)PHP,MySQL,JavaScript
2.課程
Bioinformatics: 生物信息導(dǎo)論和方法(北大高歌老師的課程,講解邏輯清晰,由淺入深),MOOC。
因?yàn)樯庞泻枚喾种?,如?duì)基因組、蛋白質(zhì)組學(xué)數(shù)據(jù)分析并給出生物學(xué)解釋;在研究算法方面,如利用機(jī)器學(xué)習(xí)的各種原理來(lái)解決生物學(xué)問(wèn)題(對(duì)基因序列原件的注釋,如對(duì)TSS,splicing sites,promoters,enhancers,positioned nucleosomes等功能區(qū)域的注釋;通過(guò)對(duì)RNA-seq,microarray,ChIP-seq等數(shù)據(jù)的分析,區(qū)分不同的疾病類型或疾病的分子標(biāo)志物(biomarkers);對(duì)基因功能的注釋,如Gene Ontology term;以及基因間互作調(diào)控網(wǎng)絡(luò)的分析);比如運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)改進(jìn)已有的生信軟件的算法,等等。可以根據(jù)將來(lái)要做什么繼續(xù)補(bǔ)充知識(shí),比如看一下斯坦福大學(xué)的Andrew Ng在coursera的機(jī)器課程呀 ,看一下統(tǒng)計(jì)學(xué)原理呀之類的。
3.文獻(xiàn)和實(shí)戰(zhàn)練習(xí)
如果是做基因組學(xué)的生信公司
RNA數(shù)據(jù)分析流程
RNA-seq:可以重復(fù)一下文章中的分析Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks當(dāng)然入門之后可以更多了解相關(guān)軟件啦,比如STAR,feature counts, Gfold, EdgeR, DESeq2,DESeq等。
找lncRNA:Recurrently deregulated lncRNAs in hepatocellular carcinoma. 這篇文章中有如何找新lncRNA的流程,可以根據(jù)文章提供的方法重復(fù)一下。
DNA數(shù)據(jù)分析流程
GATK那一套流程檢測(cè)
同時(shí)variant與疾病、eQTL等關(guān)聯(lián)分析的話,可以了解一下STATA
結(jié)合機(jī)器學(xué)習(xí)和基因組學(xué)的話,可以看一下以下文獻(xiàn):
DeepVariant:由谷歌Deep mind公司研發(fā),利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)檢測(cè)基因組上單堿基突變(SNP)和小的插入缺失(Indel),比現(xiàn)有的GATK軟件有更高的精確度。
DeepWAS:根據(jù)功能單元選擇出一組SNP的集合,與現(xiàn)有的基因組關(guān)聯(lián)分析(GWAS)檢測(cè)基因組上一個(gè)SNP與疾病的關(guān)系相比,DeepWAS能夠更綜合地分析致病基因突變,在尋找調(diào)控區(qū)域的基因突變也更為直接。DeepSEA:預(yù)測(cè)人類基因組非編碼區(qū)有功能的變異。
DeepBind:預(yù)測(cè)DNA,RNA結(jié)合蛋白的序列特征,并能識(shí)別有害的基因突變。
DeepCpG:在表觀遺傳學(xué)層面上,應(yīng)用深度神經(jīng)網(wǎng)絡(luò)算法,研發(fā)了通過(guò)單細(xì)胞測(cè)序的DNA序列和不完整的甲基化修飾數(shù)據(jù)的,用來(lái)預(yù)測(cè)細(xì)胞細(xì)胞層面是否會(huì)發(fā)生甲基化,其效果優(yōu)于現(xiàn)有軟件。
優(yōu)質(zhì)工程師考試問(wèn)答知識(shí)庫(kù)