-
- 動(dòng)物實(shí)驗(yàn)平臺(tái)
- 動(dòng)物飼養(yǎng) 疾病造模 行為學(xué)檢測(cè) 心功能 無(wú)創(chuàng)血壓 血常規(guī) 全自動(dòng)生化檢測(cè)等
- 細(xì)胞實(shí)驗(yàn)平臺(tái)
- CCK8/MTT 原代細(xì)胞分離 流式細(xì)胞實(shí)驗(yàn) 細(xì)胞劃痕 侵襲 遷移 EDU染色 轉(zhuǎn)染 穩(wěn)定株篩選
一、常見(jiàn)實(shí)驗(yàn)問(wèn)題
1. 野外取樣野外取樣無(wú)液氮、干冰等速凍如何保存?
去除葉片表面的脂化膜,剪碎葉片,存于RNA later保存液中,提取時(shí)5倍體積提取。1-2天問(wèn)題不大。
2. 血液及腫瘤樣本需要做哪些特殊處理
血液和腫瘤樣本由于RNA酶含量豐富,極易造成RNA的降解,因此在活體取樣后,需要盡快放入液氮速凍或加入RNAlater防止RNA降解。
2. 做轉(zhuǎn)錄組項(xiàng)目時(shí)RNA中很多DNA污染,可以建庫(kù)嗎?
可以,磁珠調(diào)取的方法,不會(huì)有影響。但是蛋白污染的話(huà)會(huì)有影響,有些蛋白的存在會(huì)在后續(xù)建庫(kù)造成干擾。
3. 在做真核生物轉(zhuǎn)錄組測(cè)序時(shí),會(huì)測(cè)到線粒體、葉綠體 RNA 嗎?
正常情況下是不會(huì)的,因?yàn)榫€粒體、葉綠體 RNA 不具有 polyA 尾巴的結(jié)構(gòu)。
4. RNA提取是否需要DNA酶處理?
一般的RNA試劑盒會(huì)有去除的步驟,但效果不好,如果是轉(zhuǎn)錄組,我們是ployA富集(DNA不含ployA不會(huì)被富集)建庫(kù),一般影響不大,而且上機(jī)前會(huì)有建庫(kù)的定量,對(duì)產(chǎn)量影響也不大。
5. 原核生物的rRNA去除效率是不是都可以達(dá)到90%以上
原核生物的rRNA去除效率取決于rRNA remove中探針的匹配率,商業(yè)化的探針雖然是廣譜性的,但是針對(duì)一些特殊的原核生物的rRNA的去除效率并不高,因此如果是一些沒(méi)有經(jīng)過(guò)試劑盒驗(yàn)證的原核生物,無(wú)法保證rRNA的去除效率。
6. 定量基因挑選問(wèn)題
建議轉(zhuǎn)錄組測(cè)序后定量挑選基因20個(gè)左右,先結(jié)合GO和KEGG富集分析入手,找打研究方向,結(jié)合韋恩圖分析縮小差異基因范圍,最后根據(jù)基因共表達(dá)分析和蛋白互作共表達(dá)分析找出分模塊的核心基因。
驗(yàn)證注意事項(xiàng):需挑選差異表達(dá)倍數(shù)大的,且其中至少有一個(gè)基因表達(dá)量要大。
7. QPCR進(jìn)行驗(yàn)證,驗(yàn)證的基因表達(dá)趨勢(shì)與測(cè)序結(jié)果中不一致
首先,我們需要確定檢驗(yàn)的樣品是否是同一批次,驗(yàn)證樣品的上下調(diào)關(guān)系是否與測(cè)序結(jié)果中的一致(這個(gè)需要根據(jù)測(cè)序公司具體的分析結(jié)果,比如某個(gè)基因的FC值對(duì)應(yīng)的樣品寫(xiě)的是T01 vs T02 ,那么T01就是對(duì)照組、T02是實(shí)驗(yàn)組),若樣品不為同一批次或其上下調(diào)關(guān)系顛倒了,則勢(shì)必會(huì)導(dǎo)致驗(yàn)證基因表達(dá)趨勢(shì)不一致的情況。
其次,我們需要查看驗(yàn)證基因的表達(dá)量、樣品和實(shí)驗(yàn)用的引物是否被污染,若驗(yàn)證基因表達(dá)量過(guò)低,則有可能導(dǎo)致差異不顯著,若樣品或?qū)嶒?yàn)用的引物被污染則后續(xù)結(jié)果可能也不會(huì)準(zhǔn)確,所以我們盡量不要挑選表達(dá)量太低的基因,同時(shí),需要保證樣品和實(shí)驗(yàn)引物沒(méi)有被污染。
當(dāng)以上所有情況都不存在,且結(jié)果依然不一致,這時(shí)我們需要檢查QPCR結(jié)果是否正確。如果僅一個(gè)基因驗(yàn)證結(jié)果不一致,則不足以說(shuō)明測(cè)序或者驗(yàn)證有問(wèn)題,但當(dāng)我們選擇了15個(gè)基因甚至更多時(shí),結(jié)果依然不一致時(shí),那么我們可能需要分析測(cè)序數(shù)據(jù)的結(jié)果是否正確,同時(shí)檢查結(jié)果預(yù)期是否正確。
二、常見(jiàn)分析問(wèn)題
1. 原核轉(zhuǎn)錄組測(cè)序是否可以做無(wú)參分析
不建議進(jìn)行無(wú)參分析,是因?yàn)樵松锏膍RNA一般多為順?lè)醋?,直接拼接效果?huì)很差。
2. Small RNA-seq只能捕獲到miRNA的數(shù)據(jù)么
Small RNA-seq由于其建庫(kù)的特點(diǎn),可以捕獲到miRNA、piRNA和tRNA小片段,但是由于分析流程的限制,一般sRNA-seq只分析miRNA的數(shù)據(jù)。
3. lncRNA的調(diào)控作用
影響周邊和遠(yuǎn)端基因表達(dá)(順式調(diào)控和反式調(diào)控);調(diào)控蛋白活動(dòng)及定位;產(chǎn)生小分子RNA;對(duì)其他RNA的調(diào)控作用
4. 常規(guī)表觀修飾測(cè)序(WGBS/RRBS/CHIP-SEQ/RIP-SEQ)是否需要參考基因組
物種要求:真核生物,物種有參考基因組,至少拼接到scaffold水平;具有較為完整的注釋。
5. miRNA表達(dá)及組織異構(gòu)體
在miRNA鑒定中,可能成為miRNA的reads是怎樣計(jì)算的?哪些條件會(huì)影響到mrd值?micro RNA在不同組織有異構(gòu)體的存在,是如何處理的?
與 Rfam, miRbase, RepBase和 ExonIntro 序列庫(kù)進(jìn)行比對(duì),獲得 sRNA 注釋信息,以此作為預(yù)測(cè)新的 miRNA 的基礎(chǔ)。miRNA的鑒定是利用miRDeep2軟件進(jìn)行已知及新(保守及非保守)的miRNA鑒定。miDeep2會(huì)在reads比對(duì)到基因組上的位置兩端分別延伸75、15bp進(jìn)行結(jié)構(gòu)預(yù)測(cè),此軟件認(rèn)為極可能與可能是miRNA的根據(jù)是通過(guò)mrd值來(lái)區(qū)分的,mrd>-10為可能,mrd>0為極可能;影響mrd值的有reads在基因組上的分布和堿基結(jié)合的自由能等;
6. 小RNA中,成熟序列相同的miRNA如何確定各自的表達(dá)量
測(cè)序時(shí)理論上得到的是miRNA成熟序列,通過(guò)比對(duì)數(shù)據(jù)庫(kù)中的miRNA成熟序列及前體序列來(lái)確定miRNA,這種情況下得到的reads沒(méi)有辦法判斷是屬于哪一個(gè)成熟序列相同的miRNA前體的,這樣的miRNA會(huì)列出所有成熟序列相同的miRNA,且在同一樣品中表達(dá)量相同;但是測(cè)序時(shí)是通過(guò)片段大小選擇來(lái)獲得測(cè)序文庫(kù)的,并不是嚴(yán)格意義上的只有miRNA成熟序列的reads,所以會(huì)有一些包含成熟序列上下游幾nt前體序列的reads,這種情況下,可以通過(guò)這部分非成熟序列的序列來(lái)判斷該reads是屬于哪一個(gè)miRNA前體,從而得到的成熟序列相同的不同miRNA在同一樣品中表達(dá)量則會(huì)不同。
7. lncRNA預(yù)測(cè)時(shí)為什么選擇含有2個(gè)及2個(gè)以上外顯子的轉(zhuǎn)錄本?
關(guān)于lncRNA預(yù)測(cè),目前的文獻(xiàn)中有多種不同的篩選角度和不同的標(biāo)準(zhǔn)(比如,長(zhǎng)度,外顯子個(gè)數(shù),ORF長(zhǎng)度,同已知nonconding數(shù)據(jù)庫(kù)比對(duì),不同的預(yù)測(cè)軟件,覆蓋度,FPKM值等等),篩選條件到目前為止也并沒(méi)有一個(gè)統(tǒng)一的定論,有較多文獻(xiàn)支持選擇含有2個(gè)及2個(gè)以上外顯子的轉(zhuǎn)錄本進(jìn)行篩選。
8. 差異基因篩選為什么選擇FDR?
FDR是q-value的校正值,是目前在RNA-seq中使用最普遍的公認(rèn)的Benjamini-Hochberg校正方法,可參考Benjamini and Hochberg在1995年第一次提出了FDR(False Discovery Rate)的概念以及相應(yīng)的多重檢驗(yàn)校正方法的文章。
9.外顯子,內(nèi)含子及基因間區(qū)各自的比例如何評(píng)估建庫(kù)情況?
理論上,來(lái)自成熟mRNA的reads應(yīng)該比對(duì)到外顯子區(qū)。但是,由于基因組注釋水平、可變剪切導(dǎo)致的內(nèi)含子序列保存,以及很多RNA(比如lncRNA)就來(lái)自基因間區(qū)和內(nèi)含子,因此有比對(duì)到內(nèi)含子和基因間區(qū)的reads。受物種等的影響外顯子所占比例不同,一般情況下外顯子區(qū)域所占比例超過(guò)70%即比較理想。
10. 多個(gè)Unigene注釋一樣,序列長(zhǎng)度不同,相似性較低,為什么?
首先某一基因可能比較長(zhǎng),但無(wú)參考基因組裝出的片段即Unigene很難組裝得到全長(zhǎng),得到的是這個(gè)基因上的大小不等的片段,在進(jìn)行比對(duì)的時(shí)候就會(huì)比對(duì)到同一個(gè)基因上,因此他們的注釋信息一致;
從序列來(lái)看Unigene基因的序列相似度不高,但是因?yàn)楸葘?duì)的是蛋白,所以可能他們的蛋白相似度會(huì)比較高,因此會(huì)注釋到同一基因上。
11. 無(wú)參轉(zhuǎn)錄組中同一ID下有多條序列,想得到此序列的核苷酸信息應(yīng)選哪一條?
同一個(gè)ID號(hào)下面好幾條序列,這個(gè)應(yīng)該是組裝過(guò)程中裝出來(lái)的轉(zhuǎn)錄本序列,來(lái)自同一個(gè)Component(具體見(jiàn)Trinity組裝的第二步),其ID前綴相同,后面跟著seq+數(shù)字的編號(hào)。Trinity軟件認(rèn)為這些轉(zhuǎn)錄本來(lái)源于同一個(gè)基因,因此,選取其中最長(zhǎng)的那個(gè)轉(zhuǎn)錄本的序列作為該基因的序列。
12. 差異基因分析和數(shù)據(jù)庫(kù)注釋
差異基因分析基因表達(dá)上調(diào)與下調(diào)的數(shù)目,進(jìn)行差異表達(dá)基因的聚類(lèi)分析和差異基因的注釋和富集分析。數(shù)據(jù)庫(kù)注釋COG:基于細(xì)菌、藻類(lèi)、真核生物的系統(tǒng)進(jìn)化關(guān)系構(gòu)建-對(duì)基因產(chǎn)物進(jìn)行直系同源分類(lèi)。KOG:針對(duì)真核生物,基于基因直系同源關(guān)系,結(jié)合進(jìn)化關(guān)系對(duì)基因產(chǎn)物進(jìn)行直系同源類(lèi)。Pfam:全面的蛋白結(jié)構(gòu)域注釋的分類(lèi)系統(tǒng),每個(gè)特定結(jié)構(gòu)域的蛋白序列具有一定的保守性。KEGG:系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及這些基因產(chǎn)物功能的數(shù)據(jù)庫(kù),整合了基因組、化學(xué)分子和生化系統(tǒng)等方面的數(shù)據(jù)徑查詢(xún),對(duì)催化各步反應(yīng)的酶進(jìn)行全面注解,進(jìn)行代謝網(wǎng)絡(luò)研究。包括代謝通路、藥物、疾病、基因序列以及基因組等。String:根據(jù)已知蛋白的互作關(guān)系構(gòu)建蛋白互作網(wǎng)絡(luò)。GO:基因功能分類(lèi)體系,描述生物體內(nèi)基因和基因產(chǎn)物的功能屬性,分為分子功能MF、細(xì)胞組分CC和生物學(xué)過(guò)程BP三個(gè)大類(lèi)。NR:非冗余蛋白數(shù)據(jù)庫(kù),CDS數(shù)據(jù)翻譯過(guò)來(lái)的蛋白質(zhì)數(shù)據(jù)庫(kù)。Swissprot數(shù)據(jù)庫(kù):包含了相關(guān)文獻(xiàn)且經(jīng)過(guò)校對(duì)的蛋白注釋信息數(shù)據(jù)庫(kù),可信度較高。
13. 轉(zhuǎn)錄組分析常規(guī)流程
14. 差異基因分析套路
差異基因篩選,然后做注釋和富集分析,利用韋恩圖縮小差異基因范圍,篩選出在不同時(shí)期表達(dá)模式不同的基因,同時(shí)借助已有的蛋白互作關(guān)系,分析DEG蛋白間的項(xiàng)目作用關(guān)系,發(fā)現(xiàn)新的基因。
三、常見(jiàn)名詞問(wèn)題
1. CDS和ORF
CDS是編碼蛋白質(zhì)的一段序列,ORF是從起始密碼子到終止密碼子的一段序列,不是所有的讀碼框都能表達(dá)出蛋白質(zhì),CDS一定是ORF,但ORF不一定是CDS;在預(yù)測(cè)CDS的時(shí)候是先跟數(shù)據(jù)庫(kù)比對(duì),比對(duì)上的直接提取CDS序列,比對(duì)不上的再用軟件預(yù)測(cè)。
2. Unigene N50
Unigene N50 的大小是評(píng)判轉(zhuǎn)錄組組裝效果的一個(gè)指標(biāo), 將所有 Unigene 按照從長(zhǎng)到短的順序排列,然后從長(zhǎng)到短依次相加,當(dāng)加和達(dá)到 Unigene 庫(kù)總長(zhǎng)度的 1/2 時(shí)的那條 Unigene長(zhǎng)度為 Unigene N50 的長(zhǎng)度。
3. p_value和FDR
p value:T檢驗(yàn)用于判斷兩個(gè)平均數(shù)的差異是否顯著的值。q value(FDR):為經(jīng)過(guò)多重校驗(yàn)后的p value,能更好地控制假陽(yáng)性率。
4. Read count和FPKM/RPKM
Read count:在二代測(cè)序中,每個(gè)測(cè)序反應(yīng)得到的序列為一個(gè)“read”,通過(guò)統(tǒng)計(jì)某一個(gè)“read”在整個(gè)測(cè)序中出現(xiàn)的次數(shù)即為read count,可以用read count表示RNA豐度。FPKM(Fragments Per Kilobase per Million mapped reads):FPKM與RPKM代表的意義很相近,二者區(qū)別在于FPKM是以fragment數(shù)為計(jì)算單位而RPKM以reads數(shù)為計(jì)算單位。RPKM的誕生是針對(duì)早期的SE測(cè)序,F(xiàn)PKM則是在PE測(cè)序上對(duì)RPKM的校正。在Paired-end 測(cè)序中,一個(gè)fragment就是兩條PE reads構(gòu)成的片段。由于是PE比對(duì),理論上比SE比對(duì)更可靠。
Xi:每個(gè)轉(zhuǎn)錄本比對(duì)上的片段數(shù);
li:每個(gè)轉(zhuǎn)錄本長(zhǎng)度;
N:比對(duì)成功的總reads數(shù);
RPKM(Reads Per Kilobase per Million mapped reads):以reads數(shù)為計(jì)算單位,對(duì)基因長(zhǎng)度(基因間的比較)和總數(shù)據(jù)量(樣本間的比較)做矯正;
rg:每個(gè)轉(zhuǎn)錄本比對(duì)上的reads數(shù);
flg:每個(gè)轉(zhuǎn)錄本的長(zhǎng)度;
R:比對(duì)成功的總reads數(shù);
5. 基因和轉(zhuǎn)錄本數(shù)據(jù)
定量基因表達(dá)和評(píng)估轉(zhuǎn)錄圖譜相似性只需要中等測(cè)序深度,而研究新轉(zhuǎn)錄本和可變剪切需要較深的測(cè)序深度?;颍夯虿町惙治龊突蚬脖磉_(dá)分析轉(zhuǎn)錄本:轉(zhuǎn)錄本重構(gòu)和定量:可變剪切分析二代測(cè)序技術(shù)產(chǎn)生的reads較短,短片段導(dǎo)致的信息損失需要依靠統(tǒng)計(jì)建模去推斷和彌補(bǔ):極大似然回歸和基于回歸分析,分別基于轉(zhuǎn)錄本表達(dá)量構(gòu)建混合概率模型和回歸模型,進(jìn)行最優(yōu)參數(shù)的計(jì)算。外顯子水平分析:外顯子的剪接百分比,常見(jiàn)方法有:MISO,SpliceTrap和rMATS等。MISO和SpliceTrap都構(gòu)建了類(lèi)似于貝葉斯框架下的模型,作為感興趣的參數(shù),然后可以基于其后驗(yàn)分布獲得貝葉斯置信區(qū)間。
6 Contig 與transcript
轉(zhuǎn)錄組測(cè)序的原始數(shù)據(jù)包含了很多的reads,通過(guò)序列的拼接,具有重疊區(qū)的reads會(huì)被組裝成更大的片段,稱(chēng)之為contig。將reads比對(duì)回contig,通過(guò)paired-end reads能確定來(lái)自同一轉(zhuǎn)錄本的不同contig 以及這些contig之間的距離,將這些contig連在一起,最后得到兩端不能再延長(zhǎng)的序列,稱(chēng)之為Unigene。Transcript即轉(zhuǎn)錄本。
7. 已知micRNA、保守的micRNA以及新預(yù)測(cè)的micRNA?
已知micRNA指的是序列在miRBase數(shù)據(jù)庫(kù)中百分百的比對(duì)到該物種的序列上,如果在該物種上沒(méi)有比對(duì)上但比對(duì)上了數(shù)據(jù)庫(kù)中的其他物種上我們稱(chēng)之為保守的micRNA;新預(yù)測(cè)的micRNA:通過(guò)miRDeep2軟件進(jìn)行預(yù)測(cè),有一定的read能夠比對(duì)到基因組上,并且比對(duì)位置的序列可以形成發(fā)卡結(jié)構(gòu),那么就會(huì)作為新預(yù)測(cè)的miRNA。
8. WGCNA基因共表達(dá)分析
用于識(shí)別差異表達(dá)基因的共表達(dá)模式,分析樣品間的mRNA表達(dá)的模式,將相同表達(dá)趨勢(shì)的mRNA聚類(lèi)為一個(gè)模塊對(duì)特定的基因進(jìn)行基因共表達(dá)網(wǎng)絡(luò)分析,將基因劃分為不同的模塊,探索模塊與特定表型或疾病的關(guān)聯(lián)關(guān)系,篩選關(guān)鍵基因集。
康旭禾生物提供包括動(dòng)物實(shí)驗(yàn)、細(xì)胞實(shí)驗(yàn)、分子實(shí)驗(yàn)、病理實(shí)驗(yàn)、流式檢測(cè)實(shí)驗(yàn)及論文翻譯、潤(rùn)色、投稿輔助等相關(guān)的各項(xiàng)服務(wù)。
聯(lián)系方式:19379182007
公司官網(wǎng):http://consurebio.com/
公司地址:江西省南昌市南昌縣小藍(lán)VR產(chǎn)業(yè)基地D座2樓