高能所計算中心成立于1974年,第一臺計算機是當時國內(nèi)最大的48位國產(chǎn)DJS-8(320)計算機。1984年開始建設(shè)北京正負電子對撞機(Beijing Electron-Positron Collider, BEPC)和北京譜儀(Beijing Spectrum),計算中心在國內(nèi)率先引進了當時國際先進的DEC VAX-11/780計算機,并在隨后的幾年連續(xù)進口了5臺更為先進的DEC VAX計算機并組成了計算機集群。北京譜儀于1994年升級為BESII,計算技術(shù)也從大型機(mainframe)發(fā)展到RISC工作站機群系統(tǒng),計算中心也應(yīng)計算技術(shù)的變化,先后購買了12臺HP工作站,組成了BESII的數(shù)據(jù)處理和分析環(huán)境。90年代后期,由于PC機和百兆/千兆以太網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,特別是開放源碼的Linux操作系統(tǒng)出現(xiàn),并在互聯(lián)網(wǎng)技術(shù)的催生下,發(fā)展速度異常迅猛,很快進入實用階段。計算中心于1998年開始研究和建設(shè)PC Farm,從每一個實驗一個PC Farm到逐漸整合,形成了一個中心的計算環(huán)境。
目前本中心的計算集群是國內(nèi)最大的高能物理數(shù)據(jù)平臺,包括登錄集群、計算集群、監(jiān)控報警系統(tǒng)、作業(yè)調(diào)度系統(tǒng)、分布式文件系統(tǒng)集群、磁帶管理系統(tǒng)、備份系統(tǒng)等核心組件,全部是在開源軟件和二次開發(fā)的基礎(chǔ)上建設(shè)和實現(xiàn)?,F(xiàn)在系統(tǒng)包括20000 個 X86 架構(gòu)CPU核,100張NVidia GPU V100卡, 80GB/s訪問帶寬的數(shù)據(jù)處理能力,以及服務(wù)于集群計算的20PB的全局共享磁盤存儲,服務(wù)于數(shù)據(jù)長期保存的20PB的磁帶存儲空間,年完成作業(yè)量超過4000萬個,平均計算時間超過9800萬小時,系統(tǒng)資源使用率達90%以上。除了面向高能物理的高吞吐率(HTC)數(shù)據(jù)密集型計算模式以外,系統(tǒng)還可以支持以格點QCD,分波分析,加速器模擬為代表的高性能計算(HPC),以及AI模型訓(xùn)練,內(nèi)存計算,志愿計算等多種計算和應(yīng)用模式。為了便于國際的合作和資源的共享,高能所計算中心還是一個WLGC(Wide LHC Computing Grid)的二級站點。中心數(shù)據(jù)處理平臺支持北京正負對撞機實驗產(chǎn)生的數(shù)據(jù),中日(China-Japan)和中意(China-Italy)宇宙線實驗,中美(China-U.S)大亞灣中微子實驗,以及位于瑞士日內(nèi)瓦CERN的大型強子實驗等的數(shù)據(jù)處理與分析。中心還為山東大學(xué)、中國科技大學(xué)、蘭州大學(xué)、北京航空航天大學(xué)等國內(nèi)高能物理研究機構(gòu)提供遠程運維服務(wù)。未來中心將通過分級作業(yè)調(diào)度、數(shù)據(jù)聯(lián)盟、邊緣計算等技術(shù),將這些分布式的計算資源整合成一個統(tǒng)一的高能物理計算平臺,將計算服務(wù)覆蓋到整個中國高能物理研究領(lǐng)域,提高領(lǐng)域整體的資源利用水平和管理水平。同時,我們還將根據(jù)高能所的戰(zhàn)略規(guī)劃,把服務(wù)拓展到射線科學(xué)計算、空間天文數(shù)據(jù)處理等新興的大科學(xué)計算領(lǐng)域,把計算中心建設(shè)成為一個多學(xué)科共享的支持多樣化科學(xué)應(yīng)用的數(shù)據(jù)處理平臺。