湘江畔的國防科技大學正值暑期,校園里靜悄悄的,但校內(nèi)的 “天河”大樓機房內(nèi)卻一派熱鬧景象。長達數(shù)十米的機箱整齊排列著,發(fā)出高速運轉(zhuǎn)的低沉“嗡嗡”聲,指示燈明暗交錯,“天河二號”副總設計師肖立權正帶領團隊攻關新一代高性能計算機,向新的“中國速度”發(fā)起沖鋒。
1997年,博士畢業(yè)留校的肖立權成為國防科技大學計算機學院計算機研究所的一名科研人員。從那時起,他就與巨型機一起成長。他參與了“銀河”“天河”高性能計算機多代機型的研制,從一名普通的科研人員一步步成長為國防科技大學超級計算機團隊的核心骨干。
“走別人沒有走過的路很難,但我喜歡挑戰(zhàn)!”這是肖立權常說的一句話。20世紀末,大規(guī)模計算機系統(tǒng)中通常采用電互聯(lián)技術,傳輸速率低且易受干擾,影響系統(tǒng)穩(wěn)定性。這是我國研制千萬億次級超級計算機路上的一塊絆腳石。
如何搬開這塊絆腳石?用光互聯(lián)替代電互聯(lián)是最優(yōu)解決方案,研究所將這一重任交給了肖立權。這條別人沒有走過的路,注定充滿坎坷。
2003年,肖立權受領任務后,立即著手解決這項技術難題。然而,按照他的思路做出來的系統(tǒng)根本跑不起來。
“是哪里出了問題?”那個夏天,肖立權滿腦子都在問為什么,午休時閉上眼睛,腦海中也都是屏幕上滾動的數(shù)據(jù)。“沒法睡!去實驗室!”
肖立權架起示波器、邏輯分析儀,全神貫注觀察著,生怕錯過關鍵數(shù)據(jù)。
解決思路一次次提出,但又一次次推翻。有一天,肖立權突然冒出一個想法:是不是數(shù)據(jù)傳輸有問題?靈光突現(xiàn),他一下找到了解決問題的“鑰匙”。由此,我國光互聯(lián)技術在大規(guī)模計算機系統(tǒng)中得到有效驗證,這為后續(xù)該技術在超級計算機系統(tǒng)中的應用奠定了堅實基礎。
此后,肖立權瞄準這一技術領域,啃下了一個又一個“硬骨頭”,解決了光互聯(lián)替代電互聯(lián)的系列技術難題,成功研制出我國首臺采用光互聯(lián)技術的并行計算機互聯(lián)通信系統(tǒng),使傳輸速率從原有的400Mbps一路飆升為10Gbps,實現(xiàn)數(shù)量級飛躍。
2010年11月,“天河一號”憑借優(yōu)異性能登上世界超算500強榜首,中國超算首次問鼎世界超算桂冠;2013年6月,“天河二號”以峰值運算速度每秒5.49億億次,持續(xù)計算速度每秒3.39億億次,輕松摘得世界超算500強桂冠,我國超級計算機研制達到世界領先水平;2013年11月,“天河二號”蟬聯(lián)世界超算500強榜首……
作為“天河一號”“天河二號”的副總設計師,肖立權瞄準世界高性能計算機技術前沿,不斷探索創(chuàng)新,取得了豐碩成果。
高速互聯(lián)通信是決定大規(guī)模并行計算機系統(tǒng)實用效率的關鍵,美國對中國嚴格封鎖高速互聯(lián)技術轉(zhuǎn)讓。當時,“天河一號”在國內(nèi)首次創(chuàng)新性地采用了CPU+GPU異構融合體系架構,其內(nèi)部數(shù)萬個CPU和GPU需要通過互聯(lián)通信系統(tǒng)實現(xiàn)信息交換,難度可想而知。組織并全面負責互聯(lián)通信系統(tǒng)自主設計研制任務的肖立權壓力很大。
闖關路很艱難,但肖立權走得很扎實。寒來暑往,他不僅協(xié)助制定系統(tǒng)的總體技術方案、技術路線和設計指導原則,還經(jīng)常盯在試驗一線,從原理驗證到工程實踐,一個環(huán)節(jié)都不放過。在他的帶領下,團隊開展關鍵技術、核心技術攻關,成功將“天河一號”送上世界超算第一的寶座。
雖然獲得了國際聲譽,但肖立權沒有絲毫懈怠,他早已瞄準了運算速度更快的億億次超級計算機系統(tǒng)——“天河二號”。在原有基礎上,他帶領團隊進行了10個月的“封閉攻關”,“天河二號”高速互聯(lián)通信系統(tǒng)性能得到提升,是當時國際商用互聯(lián)系統(tǒng)的兩倍。它可以把上萬顆微處理器聯(lián)系起來,共同解決同一個計算問題,解決了高效互聯(lián)中“微處理器越多效能越低”的世界難題。
在這條自主創(chuàng)新的道路上,肖立權帶領項目組進行了長達1年的封閉設計工作,自主研制出互聯(lián)通信系統(tǒng)最核心的兩塊芯片:路由器和網(wǎng)絡接口。
一臺超級計算機系統(tǒng)好比一個大城市,互聯(lián)通信系統(tǒng)就是城市的公路網(wǎng),路由器就是立交橋,網(wǎng)絡接口就是主干道出入口。一個城市公路網(wǎng)市政設施建設得再好,立交橋和主干道出入口不設計好,城市交通依然擁擠不堪。
依靠自主創(chuàng)新,肖立權帶領團隊掌握了屬于自己的核心關鍵技術。這是“天河二號”在發(fā)展迅猛、競爭激烈的世界超算領域長時間保持領先地位的主要原因,一如TOP500主要撰稿人杰克·唐加拉所說:“中國自主研發(fā)了內(nèi)部互聯(lián)技術,這是買不來的,這是他們基于芯片、路由器及自主生產(chǎn)的交換器開發(fā)出來的。”
“我們參加世界排名并不僅僅是為了得第一。世界超算500強榜單其實是一個交流平臺,只有在國際上有了聲譽,別人才愿意和我們交流。”肖立權深知,只有自立自強,掌握自主核心關鍵技術,才能在國際上掌握發(fā)言權,讓世界聽到來自中國的聲音,讓中國更好地了解國際前沿發(fā)展趨勢。
今年夏天,肖立權沒有放松,他正帶領團隊全力投入新一代高性能計算機的研制攻關,他的目標是,摘取“超級計算機的下一頂皇冠”。
轉(zhuǎn)自:環(huán)球網(wǎng)
【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉(zhuǎn)載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65367254。
延伸閱讀
版權所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964