Fig.1樣品制備和數據采集
為了提高吞吐量,作者開發了一種新的樣品制備方案,該方案由幾個手動步驟組成,便于放大(圖1)。作者比較了幾種不同的提取緩沖液成分,最后選擇了鹽酸和非離子洗滌劑NP-40的混合物,將脫鹽和蛋白質提取結合起來。蛋白質是通過同時脫礦和萃取從骨屑或骨粉中獲得的,蛋白質聚集清除磁性小球處理機器人可以自動捕獲和消化。肽通過串聯質譜快速分離和分析,每天的吞吐量為100個樣本(DDA)或每天200個樣本(DIA)。
2. 肽快速識別
Fig.2比較通過常規數據庫搜索分析的快速100 spd DDA方法和通過基于庫與無庫方法分析的快速200 spd DIA方法在保留時間內累積的前體識別。
SPIN使用非常短的在線LC梯度來加速納米流色譜與Orbitrap串聯質譜聯用。與診斷血漿蛋白質組學中最快的采集方法(每天測量約50個樣本)或傳統蛋白質組學中每天不到10個樣本的常用方法相比,我們通過數據獨立采集(DIA)和數據依賴采集(DDA)實現了足夠的蛋白質組覆蓋率,每天可識別多達200個樣本和100個樣本。在現代牛骨樣本中,快速掃描DDA在11分鐘內識別出約1200個前體,而當direct DIA在沒有光譜庫的情況下進行分析時,DIA在5.6分鐘內達到相同的識別數量(圖2c)。通過對高pH值反相色譜離線分離的多肽進行DDA分析,每個物種需要一次性生成一個專用的光譜庫,而DIA分析鑒定出的前體數量幾乎是后者的兩倍然而,DIA產生了更多的冗余和重疊前體,因此沒有產生兩倍的絕對序列覆蓋(圖2d)。在40個現代參考樣本中,DDA方法的平均覆蓋率為3678個氨基酸,因此優于無庫directDIA方法的3226個氨基酸。以文庫為基礎的DIA的平均覆蓋率最高,為4480個氨基酸。
3. 用已知物種的骨骼驗證SPIN
Fig. 3 參考物種分析
作者利用一組來自13個物種的49塊已知參考骨對不同數據采集和解釋策略的性能進行了優化和評估(圖3a)。使用基于庫的DIA將所有樣本放入正確的屬中,而無庫的directDIA不能排除黑猩猩是人類,而DDA不能排除8只綿羊樣本中的一只是山羊。當涉及到科內分類單元的位置時,這三種方法都表現得同樣好。在牛的內部,家養牛(牛牛)可以區別于歐洲野牛(野牛bonasus),但不能區別于原牛(Bos primigenius)。歐洲野牛本身無法與美洲野牛和牦牛區別開來,在一個案例中,還與瘤牛區別開來。在馬類中,馴養的馬(馬科動物caballus)成功地與驢子(馬科動物africanus asinus)區分開來,這是PMF無法做到的,但與蒙古野馬(馬科動物przewalskii)區分不出來。因此,SPIN在技術上能夠進行混合檢測,但需要對其可靠性進行評估。
4. 性能和再現性基準
Fig. 4 斯堪的納維亞鐵器時代骨骼的物種鑒定
作者利用文庫DIA和精細分組的SPIN分析得到了49個準確的物種鑒定和3個近似的物種鑒定,而11個樣品由于肽強度低而被排除(圖4B)。副本分析的比較顯示,站點覆蓋范圍為3000個氨基酸的副本之間具有完美的重現性(圖4c)。在兩個重復的99個樣品中,96個樣品的文庫DIA的SPIN分析與形態學分析一致。作者比較了library DIA、directDIA和DDA三種不同類型肽的鑒定性能,它們對參考樣品的鑒定效果非常相似。在Salpetermosen樣本集中,差異變得更加明顯。偽roc曲線分析表明,基于dia的方法優于DDA,特別是在低重復量的情況下,表明基于dia的測量具有更高的靈敏度(圖4d)。在兩種DIA方法之間,基于庫的DIA比directDIA一致產生更多的真實物種識別。
研究結論:
作者提出了一種新的遺傳物種鑒定工作流程,該流程可以彌補高通量靶向方法(如PMF、PCR或ELISA)和更強大的低通量方法(如NGS或傳統的LC-MS/MS蛋白質組學分析)之間的差距。我們證明,基于PAC的自動化樣品制備工作流可通過LC-MS/MS產生用于骨蛋白質組分析的高質量肽樣品,并允許輕松放大。在速度和成本方面,數據采集曾經是一個瓶頸,但現在卻大大縮短了,每臺MS儀器每天最多可以采集200個樣品。用于SPIN的數據解釋策略有助于對目前多達156種物種進行無偏比較,并由于FDR在肽和物種識別水平上的控制,提供了較高的可信度。基于對丹麥64塊部分降解骨骼的分析,我們得出結論,基于庫的DIA方法可以實現最高的置信度和靈敏度。
到目前為止,SPIN數據分析僅限于156個改進文庫- dia分析的13個光譜文庫。我們設想,隨著更多的研究小組共享他們的蛋白質序列數據庫和光譜庫,這些數字將會增長。此外,隨著時間的推移,SPIN工作流本身很可能會得到改進和擴展。我們認為這是一個模塊化的協議,它可以作為“分拆”的基礎與自定義構建塊方法,如:(i)樣品制備改性支持從深加工的食品中提取蛋白質,(2)數據采集用于不同的樂器,或(3)數據解釋包括性識別。我們已經接觸了SPIN的更高級的用例,比如雜交物種的識別,比如騾子。此外,它可以適應,從多個分類群溶解蛋白質混合物或量化蛋白質損傷,在未來。最后,由于每個樣品的分析成本的降低和高度的自動化程度,我們預計SPIN工作流程將使LCMS/MS對每個人更容易訪問。
參考文獻:
Rüther, P. L., Husic, I. M., Bangsgaard, P., Gregersen, K. M., Pantmann, P., Carvalho, M., ... & Olsen, J. V. (2021). SPIN-Species by Proteome INvestigation. BioRxiv.