【6.18】“青年科技工作者園地”第118次活動_基于LSTM循環(huán)神經網絡的高能物理數(shù)據(jù)熱度預測
講座內容: 基于LSTM循環(huán)神經網絡的高能物理數(shù)據(jù)熱度預測
主講人:程振京
時間:6月18日(周二)下午15:00
地點:計算中心二樓會議室
報告簡介:
高能物理計算是典型的數(shù)據(jù)密集型計算,每年需要分析PB級的海量物理數(shù)據(jù),對數(shù)據(jù)訪問性能有著越來越高的要求。構建統(tǒng)一命名空間的分級存儲系統(tǒng)方案已經被廣泛采用。一般根據(jù)訪問熱度不同將數(shù)據(jù)存儲于不同性能、不同價格的存儲設備上。當數(shù)據(jù)熱度變化時,再將數(shù)據(jù)遷移至合適的存儲層級。目前數(shù)據(jù)熱度預測廣泛采用基于人工經驗的啟發(fā)式算法,由于不同用戶計算模式的差異,預測準確率較低。提出了一種借助LSTM深度學習算法,基于文件訪問特征預測未來訪問熱度的方法,作為分級存儲中數(shù)據(jù)遷移的依據(jù)。以高能物理實驗LHAASO的真實數(shù)據(jù)為例做了對比測試,結果表明,在相同測試條件下,與已有預測模型相比,該模型具有更高的預測精度和更強的適用性。
附件下載: