來自智利圣地亞哥大學(xué)和圣母大學(xué)的研究人員利用機器學(xué)習(xí),設(shè)計了一種基于單一光波長下的折射率來識別有機化合物的方法。該技術(shù)可以用于自動化化學(xué)分析的研究和工業(yè)應(yīng)用,這種分析更便宜、更安全并且需要更少的專業(yè)知識來操作。
在發(fā)表于物理化學(xué)雜志A的論文“使用可見光機器學(xué)習(xí)識別有機化合物”中,研究人員記錄了他們獲取獨特數(shù)據(jù)集的創(chuàng)造性和新穎方式以及他們用于構(gòu)建證明的步驟的概念有機化學(xué)檢測器。
機器學(xué)習(xí)是在一個公開的過去光學(xué)實驗數(shù)據(jù)庫上進行訓(xùn)練的,該數(shù)據(jù)庫包含可追溯到1940年的科學(xué)文獻中的已發(fā)表數(shù)據(jù)。在這個數(shù)據(jù)庫中,研究人員找到了編譯61種有機分子的識別概況所需的所有參數(shù);群速度和群速度色散、測量波長范圍和樣品的物質(zhì)狀態(tài)、寬波長范圍內(nèi)的折射率和消光系數(shù)。總共應(yīng)用了61種有機化合物和聚合物的194,816條折射率和消光曲線光譜記錄。
在典型的紅外(IR)分子分類檢測器中,分子身份通過吸收峰和拉曼散射峰確認,創(chuàng)建與數(shù)據(jù)庫匹配的組合特征的指紋。有機化合物的靜態(tài)折射率是一個單值特征,沒有相同的編碼信息。這同樣適用于遠離紫外線和紅外線吸收共振的單一波長的折射率數(shù)據(jù)庫,這也許是可見光未被用于對有機分子進行分類的原因。
原始數(shù)據(jù)的初始測試達到了80%,研究人員試圖從那里提高它。原始數(shù)據(jù)庫并非旨在優(yōu)化機器學(xué)習(xí),因為其中大部分來自第一臺家用計算機發(fā)明之前進行的研究。有大量關(guān)于紫外線和紅外線波長的信息,AI正在對這些波長進行交叉訓(xùn)練。因此,研究人員決定采取更有針對性的方法。
采用了幾種數(shù)據(jù)預(yù)處理策略來為AI模擬更理想化的學(xué)習(xí)環(huán)境。目標(biāo)是創(chuàng)建一個平衡的數(shù)據(jù)集,這樣人工智能就不會僅僅根據(jù)信息量就優(yōu)先考慮某些特征而不是其他特征。過采樣和欠采樣以及基于物理的數(shù)據(jù)增強技術(shù)用于從根本上減少紅外波長在整個數(shù)據(jù)集中的影響。通過使用經(jīng)過預(yù)處理的平衡數(shù)據(jù)進行訓(xùn)練,研究人員在可見區(qū)域?qū)崿F(xiàn)了超過98%的分子分類測試準(zhǔn)確度。
研究人員表示,需要做更多的工作來擴展和推廣分類器,以識別折射率數(shù)據(jù)庫中存在的分子的結(jié)構(gòu)和其他化學(xué)特征??傊?,他們寫道,這項工作是開發(fā)遠程化學(xué)傳感器的良好起點。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!