飞腾处理器
飞腾处理器(英語:),又稱銀河飞腾处理器,是由中國人民解放軍國防科學技術大學研制的一系列嵌入式数字信号处理器(DSP)和中央处理器(CPU)芯片。[1]這個處理器系列的研發,是由國防科技大的邢座程教授[2]帶領的團隊負責研發。[3]其商業化推廣則是由中国电子信息产业集团有限公司旗下的天津飞腾信息技术有限公司負責。[4]
早期產品
第一代的飛騰製品,二進位指令集可相容於英特爾的安騰2。第二代的處理器架構,稱為FT64(飛騰-64),是一種系統單晶片,內部整合了64位元的中央處理器核心以及64位元的流式處理器,該代產品用於銀河系列超級電腦內,作為加速處理器使用。[5]
此外,還有銀河飛騰數位信號處理器,於2004年12月17日在北京通过国家鉴定;YHFT-DSP/700芯片在0.13微米工艺下YHFT-QDSP的频率达到350MHz,性能大于11.2GOPS,功耗约2.99W。[6]
飛騰-1000
設計團隊 | 中國國防科技大學 |
---|---|
生产商 |
|
微架構 | SPARCv9 |
制作工艺/製程 | 65奈米 |
核心数量 | 8 |
CPU主频范围 | 800 MHz 至 1000 MHz |
應用平台 | 超級電腦 |
飛騰-1000(FT-1000)是銀河飛騰系列的第三代產品,採用台積電的65奈米製程,共3.5億個電晶體邏輯閘,運作時脈為0.8~1.0GHz。本代架構採用了當時OpenSPARC開放源碼專案最新公開的UltraSPARC T2源碼[7],可相容於SPARCv9指令集。[8]晶片內建8個CPU核心,每核心可運行4執行緒,共64執行緒;內建4通道DDR3記憶體控制器(每通道位寬64位元);採用3路HyperTransport匯流排以及PCIe x8 2.0匯流排。[9]
在由中国国防科技大学和天津滨海新区共同研制的超级计算机天河一号A中,其中使用了2048颗国防科技大学研制的飞腾处理器(完整規格,八核64线程,主频1GHz)[10][11][12]。天河一號A理論效能峰值約4.701 petaflops(該值並未計入這批飛騰處理器的貢獻)。[9][13]這批CPU用於機組的服務節點上。[1][9]
飛騰-1500
設計團隊 | 中國國防科技大學 |
---|---|
生产商 |
|
微架構 | SPARCv9 |
制作工艺/製程 | 40奈米 |
核心数量 | 16 |
一級快取 | 每核心16KB資料快取、16KB指令快取 |
二級快取 | 每核心512KB |
三級快取 | 所有核心共用4MB |
CPU主频范围 | 至 1800 MHz |
應用平台 | 超級電腦 |
飛騰-1500(FT-1500)處理器,仍然基於SPARCv9微架構,熱設計功耗65瓦,採用台積電的40奈米製程,運行時脈1.8GHz。[14]FT-1500的峰值效能為115~144 GFLOPS,擁有16個CPU核心,每核心擁有8執行緒的多執行緒處理能力,支援256位元寬幅SIMD運算,支援積和熔加運算指令(FMA)。快取運作的時脈比CPU核心的高,為2.0GHz,每核心擁有16KB的一級指令快取、16KB的一級資料快取以及512KB的二級快取,三級快取為所有核心共用,容量4MB,其中被分為4段,每段1MB,有4個CPU核心與之共32路組相聯。快取結構採用基於目錄的快取一致性協定。[15]此外FT-1500還支援以下特性:
在由中国国防科技大学等单位研制的超级计算机天河二号中,使用了4096颗FT-1500處理器作为计算节点前端处理器。[16]
飛騰-1500A
設計團隊 | Phytium |
---|---|
微架構 | ARMv8 |
制作工艺/製程 | 28奈米 |
核心数量 | 4~16 |
CPU主频范围 | 至 2000 MHz |
應用平台 | 瘦客戶端、伺服器 |
FT-1500A,是新一代的處理器產品,主打商用伺服器市場,與FT-1500並無太多關聯之處。該代處理器也是系統單晶片(SoC)的設計,但採用ARM64微架構(AArch64),支援ARMv8指令集,由天津飞腾公司設計,採用28奈米製程製造。[17]晶片內建32通道PCIe通道,雙千兆以太網路適配器,支援ITS的GICv3中斷控制器,電源管理等。[18]目前有4核心型號以及16核心型號。[4]
飛騰-2000
飞腾2000(FT-2000)於2017年作為天河三號的預先樣機亮相於公開業界,屬於ARM家族,其宣揚在单核性能上和Intel还存在一定差距,但在多核性能上,[19]已经达到Intel服务器CPU E5 主流产品的水平。
飛騰-2000/64
設計團隊 | Phytium |
---|---|
微架構 | ARMv8 |
制作工艺/製程 | 28奈米/16奈米 |
核心数量 | 64 |
一級快取 | 每核心 32KB資料快取、32KB指令快取 |
二級快取 | 集成32MB |
三級快取 | 擴展支持 128MB |
CPU主频范围 | 至 1500~2400 MHz |
應用平台 | 雲端伺服器 |
在天河2A上,国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡,預估天河三號性能指标是神威太湖之光的8倍。FT-2000Plus采用了台积电16nm制造工艺,主频為2.0GHz—2.4GHz並將DDR4内存控制器集成到了片内。
根据实际测试FT-2000在2GHz主频下,采用GCC4.8编译器,SPEC2006的测试成绩分别为
- SPECint_rate2006 : 570分
- SPECfp_rate2006 : 482分
与Intel Xeon E5-2695v3相当。但在单线程性能上SPECint_base2006的14分落後於Xeon的25分。目前已有一些商業公司推出飞腾2000Plus處理器的伺服器和工作站產品。
参考文献
- Patrick Thibodeau. . Computerworld. 2010-11-04 [2016-06-17]. (原始内容存档于2012-10-11).
- . 国防科技大学计算机学院. [2016-06-22]. (原始内容存档于2020-11-28).
- . Ee.ust.hk. 2011-10-20 [2016-06-17]. (原始内容存档于2013-12-03).
- . cena.com.cn. [2016-06-22]. (原始内容存档于2017-05-11).
- . ust.hk. [17 June 2016]. (原始内容存档于2013-05-22).
- . cnki.com.cn. [2016-06-22]. (原始内容存档于2016-08-11).
- (PDF). Prace-project.eu. [2016-06-17]. (原始内容存档 (PDF)于2016-09-27).
- . English.people.com.cn. 2011-03-25 [2016-06-17]. (原始内容存档于2013-12-03).
- The TianHe-1A Supercomputer: Its Hardware and Software by Xue-Jun Yang, Xiang-Ke Liao, et al in the Journal of Computer Science and Technology, Volume 26, Number 3, May 2011, pp. 344-351 . [2012-02-08]. (原始内容存档于2011-06-21).
- . [2011-01-06]. (原始内容存档于2020-04-20).
- . [2011-09-04]. (原始内容存档于2016-08-11).
- . Server.it168.com. 2010-10-28 [2016-06-17]. (原始内容存档于2016-05-26).
- . ZDNet UK. 29 October 2010 [2016-06-22]. (原始内容存档于2010-10-29).
- Dongarra, Jack (3 June 2013). "Visit to the National University for Defense Technology Changsha, China" (页面存档备份,存于) (PDF). Netlib. (英文) page 9
- MilkyWay-2 supercomputer: system and application. Xiangke LIAO, Liquan XIAO, Canqun YANG, Yutong LU. Front. Comput. Sci., 2014, 8(3): 345–356 DOI:10.1007/s11704-014-3501-3 (September 6, 2013)
- . 新華社. 长沙晚报. 2013年6月19日 [2016-06-22]. (原始内容存档于2021-01-13).
- . arm.com. [2016-06-22]. (原始内容存档于2015-05-26).
- . marc.info. [17 June 2016]. (原始内容存档于2022-05-15).
- . [2018-05-20]. (原始内容存档于2018-05-20).
- . [2021-07-16]. (原始内容存档于2021-07-16).