專訪NVIDIA Tesla計算總經理

我是天才

二星fun會員

Rank: 3 Rank: 3

1^# 大中小發表於 2009-2-22 15:33 只看該作者

專訪NVIDIA Tesla計算總經理

　Tesla和NVIDIA公司傳統的Quadro、GeForce顯卡有什麼區別呢?Tesla在高性能計算領域的性能表現和應用前景如何呢?
　　近年來，關於使用GPU協同CPU進行大規模高性能平行計算的做法引起了業界的廣泛關注。特別是從去年以來，NVIDIA公司在全球推出了基於 “CPU+GPU”混合架構的Tesla高性能計算系統，並推出了基於CUDA架構的軟體程式設計環境。那麼，Tesla和NVIDIA公司傳統的 Quadro、GeForce顯卡有什麼區別呢?Tesla在高性能計算領域的性能表現和應用前景如何呢?
　　近日，NVIDIA公司Tesla計算事業部總經理 Andy Keane對上述問題做了深入淺出的闡釋。
　　Tesla和Quadro、GeForce的區別
　　記者：對於高性能計算和圖形處理應用，面對Tesla個人高性能電腦和普通顯卡，我們應該如何選擇不同的配置?
　　Andy：Tesla個人超級電腦一般需要搭配一顆四核處理器，每個CPU核心匹配一顆GPU。根據計算問題的具體情況，主記憶體容量可從4到16GB之間選擇。為CPU配備較大記憶體的系統被用於處理更大的資料集，例如地震應用程式中所使用的資料集。分子動力學等其它類型的應用程式則不需要巨大容量的記憶體，因此4GB足夠了。圖形處理方面就視應用程式而定了。對於大多數計算應用程式來說，NVIDIA板載GPU這樣的簡單GPU或一塊QuadroNVS顯卡就足夠了。如果應用程式集計算與視覺化於一身，那麼這樣的應用程式一般需要較高的顯卡性能，可選用從QuadroNVS到高端的QuadroFX5800產品。
　　記者：從硬體層面看，Tesla配備的顯存容量比GeForce更大。但Quadro也有一些4GB顯存的版本。NVIDIA如何說服消費者購買Tesla產品而不去選擇價格更便宜的Quadro或GeForce呢?
　　Andy：這裡其實有兩個問題。
　　確實有4GB顯存的Quadro顯卡，但是其價格遠高於Tesla。Quadro支援高速OpenGL渲染，速度遠高於GeForce，因此這項技術的價格自然高於Tesla。Tesla不支持OpenGL。
　　GeForce是計算用戶的另一種選擇。Tesla專為企業部署而設計，擁有更高級別的專業顯存，專為處理計算類應用程式而設計。此外，Tesla產品由NVIDIA設計、製造和提供質保。Tesla市場供應週期更長，並提供3年質保。對於這些需要更加可靠的企業級產品的公司，Tesla是最適合的產品。Telsa還有專為資料中心設計的1U系統產品。
　　記者：在後續產品及晶片技術規格上，Tesla是沿用同期的GeForce和Quadro產品，還是採用只為計算用途而重新設計的晶片和架構?
　　Andy：當前的策略是在Tesla產品線中採用具備特殊特性的標準GPU。現在，GeForce、Quadro以及Tesla中的計算特性是相同的，但是在將來的產品中，Tesla將擁有專為高性能計算而設計的其它特性。這些產品線中的性能級別也會有所變化。
　　通過在專業級圖形產品中使用與消費級相同的GPU，Tesla在容量較小的高性能計算市場上獲得了規模經濟效益。這就是所有定制高性能計算處理器與系統專業供應商被市場淘汰的主要原因，未來唯一可行的技術是基於大眾市場的技術，例如GPU。
　　GPU與CPU計算的不同
　　記者：Tesla基於NVIDIACUDA，該技術最顯著的特點就是能夠利用GPU的平行計算能力，在大規模、高頻寬計算中有著極大的優勢。但是，面對串列計算密集型任務，Tesla是否有解決辦法呢?
　　Andy：GPU及其內部的CUDA架構是專為平行計算而設計的。
　　串列計算是一種有很大區別的架構，這種架構的設計目的是為了解決不同的問題。CPU執行指令的方式就是一個接著另一個地執行。CPU中有許多能夠加速串行計算的技術。快取記憶體、無次序執行、超標量技術、分支預測……均為抽取指令的技術或一系列指令的串列級並行機制。CPU對片上快取記憶體的設計與容量的依賴也非常大。如果程式大小與CPU快取記憶體容量不匹配，那麼該程式在CPU上的運行速度將會很慢。
　　GPU內部的平行計算架構圍繞兩個基本概念而設計。首先，程式中的資料可分成許多個部分，而為數眾多的核群可以並行地處理這些資料。第二個架構方面的設想是，資料將不與快取記憶體匹配。例如在圖形計算或石油天然氣資料處理上，資料量可能會達到百萬位元組甚至是太位元組，用快取記憶體來容納如此巨大的資料量幾乎是不切實際的。考慮到這兩點設想，GPU被設計為能夠使用數以千計的執行緒，所有執行緒均並行地執行，能夠訪問巨大容量的本機存放區器。在最新的Tesla產品中，每顆GPU均配備4GB記憶體，可容納待執行的資料。同時針對反復使用的資料，還設有較小的片上存儲空間，GPU所配備的巨大量存放區等同於CPU內部的快取記憶體，只是容量大了許多倍而已。
　　Tesla在高性能計算領域
　　記者：目前GPU系統在全球高性能電腦TOP500排行榜中最好的成績是第29位——東京大學的Tsubame超級電腦。在您看來，到2010年之前，Tsubame是否有機會躋身世界十強超級電腦?還有哪些超級電腦有希望躋身世界十強或五百強?
　　Andy：我不能代表東京工業大學超級計算領軍人物的意見。但東京工業大學全球科學資訊和計算中心總監SatoshiMatsuoka博士曾公開表示，他打算使用GPU在2010年打造出一台榮登世界最快榜單的電腦。還有更多使用GPU打造的超級電腦。美國國家超級運算應用中心(NCSA)以及法國原子能委員會(CEA)是兩家著名的超級計算中心，他們將躋身下一屆世界五百強榜單。
　　記者：當前，NVIDIA GPU的雙精度性能僅相當於單精確度的8%。到2010年之前，你認為這種性能可以有多大的改善?NVIDIA會採取怎樣的技術手段來確保這種性能提升呢?
　　Andy：當前10系列GPU是首批擁有雙精度的NVIDIA處理器。過去這種性能曾作為GPU的一個模組添加在GPU當中。而在這一代產品中，我們為每組八個單精確度處理器加入了一個雙精度單元。隨著快速發展，未來的GPU將擁有更多雙精度單元。由於GPU的性能一般每年都會翻一番，未來雙精度性能將至少比當前的速度快5倍。
　　記者：中國的超級電腦使用者在獲取軟體時，要麼購買商務軟體，要麼自己開發，或者在商務軟體方案的基礎上進行二次開發。CUDA與獨立軟體廠商之間有一定的合作，那麼，你們有沒有成熟的軟體應用程式推薦給使用者使用?另外，CUDA怎樣説明那些想要自己開發軟體的使用者?
　　Andy：我們與打算發佈超級計算軟體的獨立軟體廠商都進行了積極的開發工作。分子動力學領域的《NAMD/VMD》以及《GROMACS》是為群集GPU發佈的兩個應用程式例子。在美國的超級計算展會上，我們還展示了許多用於石油天然氣領域地震處理、量子化學以及 Ansys有限元設計的應用程式。
　　對於想要自己設計和開發應用程式的開發人員，用於CUDA架構的平行計算開發C語言編譯器可從 NVIDIA網站上免費下載。PortlandGroup的Fortran等其它編譯器也正在陸續推出。有很多來自NVIDIA以及其它來源的程式庫，這些庫使應用程式更易於開發。針對這些不懂C語言或Fortran的開發人員，Accelereyes以及Wolfram(Mathematica)等公司還提供了GPU加速版的軟體。因此你可以看到，利用GPU計算優勢的方式有許多種。
　　記者：今年NVIDIA推出了Tesla個人高性能電腦，並會與惠普、CRAY公司聯合發佈一系列的小型高性能計算系統。這是否意味著NVIDIA認為高性能計算將從大型電腦發展到桌上型電腦以及桌邊型電腦上來?這對傳統超大型電腦會產生怎樣的影響?
　　Andy：想要對科學技術產生最大的影響，高性能計算就必須發展到科學家們的桌面上。每一名研究人員、科學家以及工程師都應該擁有自己的超級電腦，這些電腦應該具備足夠的實用性能來滿足他們的工作需要。想像一下如果這些才華橫溢的人們能夠更快地解決問題，那麼科學發展的節奏將會變得怎樣。憑藉這些基於GPU的工作站以及擁有相容處理器的超級電腦，現在的技術計算達到了前所未有的全新水準。
　　在接下來的幾年裡，GPU將越來越多地被大型計算所採用。GPU擁有超高的計算密度和顯存頻寬，足以支援這種計算性能的增長。GPU將成為超級電腦中極其重要的動力源(600405,股吧)泉。GPU每年的出貨量數以百萬計，在超級計算領域中，它現在已經成為高性能、低能耗並且是人們買得起的並行處理器。
【作者：佚名來源：比特網】 (責任編輯：和訊網站)

TOP

‹‹ 上一主題 | 下一主題 ››