給你一段5分鐘的錄音,從這段錄音里你多能夠獲得多少信息?根據威斯康星大學麥迪遜威絲曼中心和威斯康星發(fā)現研究院的新研究表明,僅靠5分鐘的談話就足以判斷某個人是否易患遺傳疾病以及相關的并發(fā)癥。
早這項剛剛發(fā)表于《Scientific Reports》的研究中,研究人員利用機器學習能力分析了數百種語音記錄,并能夠準確地識別個體的突變前期的脆弱的X染色體,具有這種特征的染色體會增加神經退行性疾病、不孕不育等病癥的風險,此外,攜帶該染色體的人群的后代容易發(fā)生X染色體易損綜合征。
X染色體易損綜合癥的主要特征是智力和身體殘疾,目前全世界數百萬人都具有突變前期脆弱的X染色體。作為該研究的參與者,威斯康星大學研究生院副院長Marsha Mailick教授說:“這些處于突變前期的病癥仍并沒有被有效的診斷,人們通常不知道他們的患病風險增加了?!?
對突變前期脆弱的X染色體進行診斷是一項困難的工作,該工作極為耗時并且需要大量的資源導致價格昂貴?!拔覀兊难芯啃〗M希望開發(fā)一種快速、經濟、有效篩選方法,”Mailick說。正是應著這樣的訴求,他們開發(fā)了機器學習-人工智能計算程序。這個新型的機器人可以通過現有數據進行“訓練”,隨后去分析新信息。
威斯康星大學生物醫(yī)學工程系副教授Kris Saha認為:“初,我們要花費數小時的時間來分析和注釋每個記錄,通過這樣的大量的工作,終使用它們的時候只需要不到一秒鐘。”
Mailick及其同事在之前的研究中已經表明,系統的進行語音記錄分析,可以產生有價值的關于具有突變前期脆弱X染色體的家庭的信息。2012年,威斯康星大學副校長Jan Greenberg領導的一項研究分析了五分鐘的母親談論他們的患有X染色體易損綜合癥的孩子的語音記錄。研究顯示,父母營造的溫暖、積極的家庭氛圍能夠減少孩子的行為問題。
威斯康星大學通訊科學與病癥學副教授Audra Sterling選用了相同的錄音進行研究,結果表明在具有突變前期脆弱X染色體的中年和老年婦女群體中,年齡和言語障礙有強烈的相關性。這些研究結果表明,錄音可以跟蹤具有突變前期脆弱X染色體的老年人的疾病發(fā)展進程。
Mailick說:“以往進行語音特征編碼十分耗時且需要臨床專業(yè)知識,但新的研究中所使用的方法不需要這些特性。”Saha、Greenberg、Sterling、Mailick和研究生Arezoo Movaghar聯合設計了初始的機器學習算法,該算法可以智能的將患者區(qū)分為兩組:患者有攜帶脆弱X染色體的母親和未攜帶的母親。
研究人員先分析了100個5分鐘的具有脆弱X染色體的母親所談論的具有X染色體易損綜合征的孩子的錄音,隨后分析了另外100個自閉癥譜系障礙兒童的母親的錄音。
基于錄音和機器學習算法,研究人員創(chuàng)建了語言和認知功能的列表,例如記錄中的句子的平均長度或填充暫停的數量,例如“啊”或“哦”的發(fā)音方法,這些特征可以非常有效的區(qū)分兩組的不同。目前根據這些顯著的特征,機器學習算法可以達到81%的區(qū)分準確性。
根據研究人員的測算,與單獨使用基因檢測相比,使用機器學習的篩查方法在人群中診斷出1000名具有突變前期脆弱X染色體的患者可以節(jié)省超過1100萬美元。Mailick說:“這項工作是邁向更快、更具成本效益的篩選過程的步。我們計劃擴大對其他人群的篩選,例如具有脆弱X染色體的男性?!?
Saha說:“本研究中開發(fā)的機器學習算法不局限于脆弱X染色體診斷,未來其他疾病的診斷也可能用該算法實現。”Movaghar表示:“我們希望簡化收集數據的方式?!盡ovaghar正在致力于開發(fā)移動應用來完成這一目標。該應用會問一系列簡單的個人和醫(yī)療問題,然后記錄一個五分鐘的語音樣本,數據甚至可以來自智能手機或家庭智能揚聲器中的音頻記錄。