成都伯克利實(shí)驗(yàn)室重大醫(yī)學(xué)AI成果,解決世界上最緊迫
admin 2020-09-09 04:38:34 閱讀
小鼠卵細(xì)胞切片對(duì)應(yīng)的手動(dòng)分割
美國能源部勞倫斯伯克利實(shí)驗(yàn)室的數(shù)學(xué)家們,開發(fā)了一種針對(duì)實(shí)驗(yàn)成像數(shù)據(jù)的新的機(jī)器學(xué)習(xí)算法
。與典型的機(jī)器學(xué)習(xí)算法需要成千上萬的訓(xùn)練圖像不同,這種新算法需要的訓(xùn)練圖像少得多,而且速度也提高了不少。伯克利實(shí)驗(yàn)室的能源高級(jí)數(shù)學(xué)研究與應(yīng)用中心(簡(jiǎn)稱CAMERA)的Dani?l Pelt和James Sethian,通過開發(fā)一種他們稱之為“多尺寸密集卷積神經(jīng)網(wǎng)絡(luò)”(MS-D)的新算法
,顛覆了傳統(tǒng)的機(jī)器學(xué)習(xí)理念。和傳統(tǒng)方法相比,新方法需要的參數(shù)更少,收斂更快,而且可以基于非常小的數(shù)據(jù)集進(jìn)行學(xué)習(xí)。他們提出的這種方法已經(jīng)被用于從細(xì)胞圖像中提取生物結(jié)構(gòu),而且可以作為多個(gè)研究領(lǐng)域分析數(shù)據(jù)的主要計(jì)算工具。當(dāng)實(shí)驗(yàn)設(shè)備以更高的速度生成更高分辨率的圖像時(shí)
,科學(xué)家們很難對(duì)得到的數(shù)據(jù)結(jié)果進(jìn)行管理和分析,這些工作通常需要手動(dòng)完成。2014年,Sethian在伯克利實(shí)驗(yàn)室建立了一個(gè)集成的交叉學(xué)科中心CAMERA,目的是開發(fā)美國能源部科學(xué)用戶設(shè)施辦公室實(shí)驗(yàn)所需的基礎(chǔ)數(shù)學(xué)方法。CAMERA是該實(shí)驗(yàn)室的計(jì)算研究部門的一部分。“在許多科學(xué)應(yīng)用中
,研究人員需要耗費(fèi)大量的體力勞動(dòng)來標(biāo)注和勾畫圖像,有時(shí)候?yàn)榱说玫綆讖埞串嬀?xì)的圖像,甚至要花費(fèi)幾周時(shí)間。我們的目標(biāo)是開發(fā)出一種能基于非常小的數(shù)據(jù)集進(jìn)行學(xué)習(xí)的技術(shù)”,Sethian說道。Sethian是加州大學(xué)伯克利分校的數(shù)學(xué)教授。這項(xiàng)算法的詳細(xì)介紹發(fā)表在了2017年12月26日的美國國家科學(xué)院學(xué)報(bào)上
。“這項(xiàng)突破源于我們意識(shí)到,通過放大和縮小
,在不同尺寸下捕捉特征的方法,可以用在單個(gè)層上處理多個(gè)尺寸的數(shù)學(xué)運(yùn)算來取代,” Pelt介紹道了解生物細(xì)胞的內(nèi)部結(jié)構(gòu)是該方法非常富有前景的應(yīng)用領(lǐng)域之一。在一個(gè)項(xiàng)目中
“我們實(shí)驗(yàn)室正在研究細(xì)胞結(jié)構(gòu)和形態(tài)如何影響或控制細(xì)胞的行為
?div id="d48novz" class="flower left">用更少的數(shù)據(jù)獲取更多的科學(xué)真理
如今,圖像無處不在
。智能手機(jī)和傳感器產(chǎn)生了一批珍貴的圖像,其中很多都帶有相關(guān)的標(biāo)記信息?div id="d48novz" class="flower left">這類方法需要數(shù)以百萬計(jì)的標(biāo)記過的數(shù)據(jù)作為引導(dǎo),通過調(diào)整一系列隱藏的內(nèi)部參數(shù)來“學(xué)習(xí)”其中的規(guī)律
,這個(gè)過程需要使用巨型計(jì)算機(jī)并花費(fèi)大量的時(shí)間。如果我們沒有這么多標(biāo)記好的圖像該怎么辦呢?要知道,在很多領(lǐng)域,如此龐大的數(shù)據(jù)是難以企及的奢侈品。生物學(xué)家記錄下細(xì)胞圖像,并煞費(fèi)苦心地手動(dòng)勾勒出邊界和結(jié)構(gòu)。對(duì)他們來說,為了得出一個(gè)完整的三維圖像而花費(fèi)數(shù)周時(shí)間,是很稀松平常的事情。材料科學(xué)家利用斷層重建技術(shù)來觀察巖石和材料,擼起袖子手動(dòng)標(biāo)記不同的區(qū)域對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)算法來說
多尺寸密集卷積神經(jīng)網(wǎng)絡(luò)
機(jī)器學(xué)習(xí)在成像問題中的許多應(yīng)用
而新的“多尺寸密集”網(wǎng)絡(luò)結(jié)構(gòu)避免這樣的復(fù)雜過程,它用擴(kuò)張的卷積替代縮放操作,以捕捉各種空間范圍下的特征
,在單個(gè)層中使用多個(gè)尺度,并將所有中間圖像緊密地連接起來。新的算法只需要很少的中間圖像和參數(shù)就能獲取精確的結(jié)果,而且不需要調(diào)整超參數(shù)以及額外的層或連接來支持訓(xùn)練。從低分辨率數(shù)據(jù)中獲取更精確的結(jié)果
這種方法所面臨的一大不同挑戰(zhàn)就是
,要從低分辨率的輸入中產(chǎn)生高分辨率的圖像。任何嘗試過把圖像放大的人都知道,當(dāng)圖像的尺寸變大時(shí)畫質(zhì)也會(huì)變得糟糕新的應(yīng)用方向
Pelt和Sethian正在努力將他們的研究成果應(yīng)用到一系列新的領(lǐng)域,比如快速實(shí)時(shí)分析同步加速器光源產(chǎn)生的圖像
Pelt說道:“這些新方法令人振奮
CAMERA由美國能源部科學(xué)辦公室的高級(jí)科學(xué)計(jì)算研究和基礎(chǔ)能源科學(xué)辦公室支持
勞倫斯伯克利國家實(shí)驗(yàn)室通過推進(jìn)可持續(xù)能源