龙芯是中国科学院计算所自主研发的通用CPU,采用自主LoongISA指令系统,兼容MIPS指令。2002年8月10日诞生的“龙芯一号”是我国首枚拥有自主知识产权的通用高性能微处理芯片。龙芯从2001年至今共开发了1号、2号、3号三个系列处理器和龙芯桥片系列,在政企、安全、金融、能源等应用场景得到了广泛的应用。龙芯1号系列为32位低功耗、低成本处理器,主要面向低端嵌入式和专用应用领域;龙芯2号系列为64位低功耗单核或双核系列处理器,主要面向工控和终端等领域;龙芯3号系列为64位多核系列处理器, 主要面向桌面和服务器等领域。

2015年3月31日,中国发射首枚使用“龙芯”北斗卫星。

2019年12月24日,龙芯3A4000/3B4000在北京发布,使用与上一代产品相同的28nm工艺,通过设计优化,实现了性能的成倍提升。使用龙芯公司最新研制的新一代处理器核GS464V,主频1.8GHz-2.0GHz,SPEC CPU2006定点和浮点单核分值均超过20分,是上一代产品的两倍以上。龙芯坚持自主研发,芯片中的所有功能模块,包括CPU核心等在内的所有源代码均实现自主设计,所有定制模块也均为自主研发。2020年3月3日,360公司与龙芯中科技术有限公司联合宣布,双方将加深多维度合作,在芯片应用和网络安全开发等领域进行研发创新,并展开多方面技术与市场合作。

2020年,龙芯团队完成了.Net Core 3.1在龙芯上的移植。此次龙芯移植了.Net,可以解决很多软件生态问题。

2021年4月龙芯自主指令系统架构(Loongson Architecture,以下简称龙芯架构或LoongArch)的基础架构通过国内第三方知名知识产权评估机构的评估。[13]

中文名

龙芯

外文名

Loongson

别名

GODSON1

研发单位

中国科学院计算所

分类

电子配件

研发背景

据美国《华尔街日报》2015年4月9日报道,美国政府禁止企业向与世界上运算速度最快的超级计算机有关的中国设施出口技术,这对英特尔和其他硬件供应商来说是一个打击,给中美两国之间的一系列科技争端再添一项。[1]

这一限令包含在美国商务部发布在联邦政府网站的一份公告中,其日期标明为2月18日,即中国除夕,但直到4月9日才有媒体获悉其存在。被列入限制名单的分别是中国国防科学技术大学、国家超级计算机长沙中心、国家超级计算机天津中心和国家超级计算机广州中心。[2]

公告声称,美国政府认定名单上的这些机构“涉及违反美国国家安全或外交政策利益的活动”。例如,“中国国防科学技术大学采用源自美国的多核、主板和处理器生产天河-1A和天河二号”,这两个系统“据信被用于核爆炸活动”。[2]

如果有美国公司要向名单上的4家中国机构出售相关技术,必须先向美国政府申请出口许可。但正如公告所指出的那样,这类许可的申请“通常会遭到政策性的拒绝”。因此这一公告实际上相当于禁令。[2]

回应质疑

2001年到2010年,龙芯尚未成立公司,还只是中科院计算机所下属的课题组。“那时全部都是国家掏钱,花了国家4亿多。我把这个投资叫天使投资。”胡伟武说。

2010年,龙芯团队成立龙芯中科技术有限公司,从研发走向产业化。没人愿意投资,胡伟武说,最后是北京市政府出面,牵头投资1亿,又找企业跟投1亿,龙芯团队自己出资500万元人民币。当时投资人对胡伟武说,我知道投龙芯肯定得赔,但赔了也得投。

2015年,是龙芯的转折点,龙芯实现了盈亏平衡,同时,社会资本“鼎晖”也看中了龙芯的盈利能力,开始投资龙芯。从中央政府的“天使投资”,到地方政府的“A轮融资”,再到“B轮”社会资本,龙芯的资本接力棒正体现了中国的制度优越性,“换个国家可能就做不起来”。

2017年,龙芯实现了1.5亿的销售收入,利润2000多万元。

2018年,龙芯发展进入新阶段,龙芯利润比2017年翻番,实现了现金流的净增加,龙芯给国家交的2000多万元税款,已超过了国家给龙芯各类补助的总和——这意味着龙芯已彻底不用国家“输血”。

2019年,“今年龙芯上半年的收入已超过去年全年,利润是去年全年的1.3倍左右。”胡伟武说,“预计最多到后年,龙芯给国家交的税,就会超过之前对我们所有的研发投入。”2019年龙芯芯片出货量已达到50万颗以上,在国产化应用市场份额领先。[3]

研制课题

龙芯

2001年5月,在中科院计算所知识创新工程的支持下,龙芯课题组正式成立。2002年8月10日,首片龙芯1号芯片X1A50流片成功。龙芯最初的英文名字是Godson,后来正式注册的英文名为Longstanding。龙芯CPU由中国科学院计算技术所龙芯课题组研制.由中国科学院计算技术所授权的北京神州龙芯集成电路设计公司研发,前期批量样品由台湾台积电生产。

尽管的“龙芯”还存在着诸多问题与主流CPU相比性能上还有不少差距,还不能与Intel和AMD的CPU在PC市场上竞争,但坦率讲,“龙芯”的境遇已经比当年的“联想汉卡”好多了。回想当年的“联想汉卡”是由做大型机出身的毫无产业经验的科研人员一块一块的手工焊接而成、又一块一块的人工检测。据说1986年,联想第一线销售人员每天接到的投诉电话和定货电话几乎一样多----每卖出100块“汉卡”,就有30块出问题;而“龙芯”不仅获得了中科院重大知识创新工程项目和国家863计划的支持,通过了严格的成果鉴定、基准程序测试和产品测试,可进入商品化生产;还得到了各地政府和企业的大力支持,已在江苏省常熟市建立了产业化基地。关于MIPS结构授权与龙芯自主性等问题(From采访龙芯总设计师胡伟武)[4]

龙芯架构

龙芯指令系统LoongISA在MIPS64架构500多条指令基础上,在基础指令、虚拟机指令、面向X86和ARM的二进制翻译指令、向量指令四个方面增加了近1400条新指令。

龙芯在获得MIPS永久授权的同时,自行扩展了:

148条LoongEXT指令

5条LoongVM指令

213条LoongBT指令

1014条LoongSIMD指令

将MIPS原本的527条指令,扩展为1907条,发展成为龙芯自己的LoongISA,可以自主扩展指令集,在发展方向上可以自主选择。龙芯坚持源代码自己写,处理器核自己设计,优点是拥有自主发展权,但技术门槛也最高,因此是Hard(困难)模式。

新一代处理器

2019年12月24日,龙芯中科技术有限公司今天在京发布新一代通用处理器3A4000/3B4000。[3]

龙芯3A4000/3B4000是龙芯3号系列处理器中首款基于GS464v微架构的四核处理器。相比上一代GS464e微架构,进一步优化流水线,提升运行频率,加强对虚拟化、向量支持、加解密、安全机制等方面的支持。相比上一代四核处理器龙芯3A3000,芯片整体实测性能提升一倍左右。操作系统应用程序与龙芯3A3000实现二进制兼容。龙芯3A4000/3B4000采用全新的FCBGA-1211封装,不再向前兼容。龙芯3B4000支持多达八片结构的多路一致性互连。

芯片

​龙芯3A4000

​主频

​1.5Hz–2.0GHz

峰值运算速度

​128GFlops@2.0GHz

核心个数

​4

​处理器核

​64位超标量处理器核GS464v;MIPS64兼容;支持128/256位向量指令;四发射乱序执行;2个定点单元、2个向量单元和2个访存单元

高速

缓存
​64KB私有一级指令缓存、64KB私有一级数据缓存;256KB私有二级缓存;共享8MB三级缓存
展开表格

研制年谱

龙芯一号

2001年5月,在(中国大陆)中科院计算所知识创新工程的支持下,龙芯课题组正式成立。

2001年8月19日,龙芯1号设计与验证系统成功启动linux操作系统,10月10日通过由中国科学院组织的鉴定。

2002年8月10日,首片龙芯1号龙芯XIA50流片成功。

2002年9月22日龙芯1号通过由中国科学院组织的鉴定,9月28日举行龙芯1号发布会。中国人大常委会副委员长路甬祥、全国政协副主席周光召参加了龙芯1号发布会。

2003年10月17日,龙芯2号首片MZD110流片成功。

2004年9月28日,经过多次改进后的龙芯2C芯片DXP100流片成功。

2004年11月,中国国务院总理温家宝视察中科院计算所听取龙芯研发情况汇报。

2005年2月,中国国家主席胡锦涛等党和国家领导人在参观中科院建院55周年展览时参观了龙芯处理器展览。

2005年1月31日举行了由中国科学院组织的龙芯2号鉴定会,2005年4月18日在北京人民大会堂召开了由科技部、中科院和信息产业部联合举办的龙芯2号发布会,人大常委会副委员长顾秀莲参加了龙芯2号发布会。

2006年3月18日,龙芯2号增强型处理器CZ70流片成功。“龙芯”也要对Intel说“不”了(此说法有带广告宣传的性质)

2006年10月,中法两国在北京签署了关于中国科学院与意法半导体公司关于龙芯处理器的战略合作协议,中国国家主席胡锦涛与法国总统希拉克共同出席了协议的签字仪式。

2007年7月31日,龙芯2F(代号PLA80)流片成功,龙芯2F为龙芯第一款产品芯片。

2008年3月,北京龙芯中科技术服务中心有限公司正式成立,龙芯开始产业探索。

2009年9月28日,我国首款四核CPU龙芯3A(代号PRC60)流片成功。

2010年9月,龙芯大CPU系列的首款多核处理器产品——龙芯3A开始量产,中CPU系列的最新产品龙芯2G流片成功。龙芯2G在设计规格上相当于龙芯3A的单核版。

2011年初,龙芯一号系列芯片家族中的新成员——龙芯1B芯片流片成功,龙芯1B是一款32位SoC芯片,片内集成32位处理器核、LCD显示接口、以及丰富的IO接口。该款芯片延续了龙芯处理器高性能、低功耗的优势,能够满足超低价位云终端、工业控制/数据采集、网络设备、消费类电子等领域需求。

2011年4月,龙芯3B流片成功。

2011年底,在国家核高基项目的支持下,龙芯历史上最为复杂,也是设计难度最高的一款芯片--龙芯2H流片成功。

2012年10月,龙芯3B 1500流片成功。处理器采用32纳米工艺,硅片面积160mm2。支持1.15v-1.3v变压,动态变频。实测核心频率1.3GHz - 1.5GHz,HT总线频率1600MHz,DDR3总线频率600MHz以上。龙芯3B 1500集成8核向量处理器,峰值运算能力可达192GFLOPS,功耗约为40w。每核配置两级私有256KB 缓存,所有核心共享片上三级缓存,总容量达8MB。支持双处理器通过HT总线直连构成16核CC-NUMA系统。龙芯3B 1500处理器结构及封装引脚基本兼容龙芯3B 1000。龙芯3A/3B使用的内核、操作系统及上层应用可支持龙芯3B 1500。

2013年4月,龙芯1C芯片[5]流片成功,龙芯1C芯片是基于LS232处理器核的高性价比单芯片系统,可应用于指纹生物识别、物联传感等领域。

2014年3月19日,龙芯1D芯片的量产版本(LS1D4)完成流片封装。龙芯1D是一款专门为超声波流量表应用而定制设计的数模混合SoC,片上集成了LS132处理器核、超声波时间测量、超声波脉冲发生器、温度测量单元、红外收发器、段式LCD控制器、A/D、空管检测单元、超声波换能器正常检测、模拟比较器等功能部件以及串口、液晶显示等接口。龙芯1D具有高精度、低功耗、低成本的特性,拥有广阔的市场前景。

龙芯

2014年4月,龙芯公司推出了龙芯3B六核桌面解决方案。龙芯3B六核芯片是一个配置为六核的高性能通用处理器,采用32nm工艺制造,工作主频为1.2GHZ。该解决方案使用mini itx规格主板,板载AMD RS780E南桥芯片,配置1个千兆网络接口,另外具有PCI、PCIe、SATA、USB等多种外设接口,并且可配备hd6770独立显卡以及SSD硬盘等,具有良好的可扩展性。

2015年8月18日,龙芯中科正式发布其新一代处理器架构产品,包括自主指令集LoongISA、新一代处理器微结构GS464E、新一代处理器“龙芯3A2000”和“龙芯3B2000”、龙芯基础软硬件标准以及社区版操作系统LOONGNIX。[6]

众所周知,CPU是决定电脑性能的核心部件,也是整个系统的核心。其负责整个系统指令的执行、数学与逻辑的运算;数据的存储与传送;以及对内对外输入/输出的控制。而在这个电脑核心部件市场领域里,人们最为熟悉的两个品牌无疑是Intel和AMD,他们在处理器市场的强势地位似乎无人能撼动。在CPU技术上,我们跟国外厂商有着较大的差距,缺乏具有自主知识产权的CPU芯片,是中国计算机产业的一大“芯”病,也是我们这些电子工作者、网络人胸口永远的痛。

过去,代表着国际IT顶尖技术的CPU芯片一直被英特尔等国外巨头所垄断,中国企业及消费者为之付出了巨额版权费。好在神州龙芯公司先后推出了“龙芯1号”、“龙芯2号”,打破了中国无“芯”的历史。“龙芯”的诞生被业内人士誉为民族科技产业化道路上的一个里程碑。商品化的“龙芯”1号CPU的研制成功标志着中国已打破国外垄断,

初步掌握了当代CPU设计的关键技术,为改变中国信息产业“无芯”的局面迈出了重要的步伐,对中国形成有自主知识产权的计算机产业有重要的推动作用,对中国的CPU核心技术、国家安全、经济发展都有举足轻重的作用。我们有信心:“龙芯”对Intel说“不” !

2019年12月24日,“龙芯”发布自主研发的新一代通用处理器(CPU),单核通用处理性能大幅提升,并实现了CPU和主板升级均不影响操作系统兼容性,2019年出货量达50万颗以上。[7]

2021年4月15日,龙芯中科宣布,其自主指令系统架构(Loongson Architecture,以下简称龙芯架构或LoongArch)的基础架构通过国内第三方知名知识产权评估机构的评估,并在2021年信息技术应用创新论坛主论坛上正式对外发布。[12]

芯片系列

龙芯一号

(英文名称Godson-1)

龙芯一号CPU IP核是兼顾通用及嵌入式CPU特点的32位处理器内核,采用类MIPS III指令集,具有七级流水线、32位整数单元和64位浮点单元。龙芯一号CPU IP核具有高度灵活的可配置性,方便集成的各种标准接口。图1显示了龙芯一号CPU IP核可配置结构,其中虚线部分表示用户可根据自己的需求进行选择配置,从而定制出最适合用户应用的处理器结构。主要的可配置模块包括:浮点部件、多媒体部件、内存管理、Cache、协处理器接口。浮点部件完全兼容MIPS的浮点指令集合,浮点部件及其相关的系统软件完全符合ANSI/IEEE 754-1985二进制浮点运算标准。浮点部件主要包括浮点ALU部件和浮点乘法/除法部件,用户可根据自己的实际应用选择是否添加。媒体部件复用了MIPS浮点指令的Format域,并复用了浮点寄存器堆,媒体指令集基本对应了Intel SSE媒体指令集合的各种操作。

内存管理部件有三种工作模式,即标准模式、直接映射模式和无映射模式。在标准模式下,TLB分为ITLB和DTLB两部分,每部分均由48项页表项组成,同时支持mapped和unmapped的从虚拟地址到物理地址的变换方式;TLB也可只进行直接映射,不使用CAM和RAM,以减小面积;而无映射模式下甚至可以去掉TLB,采用直连SRAM的形式实现访存。龙芯一号CPU IP核的Cache分为指令Cache和数据Cache,两部分独立配置,以4K为一路,可配置为4路、2路和0路。用户可根据应用需要,确定所需Cache的大小,甚至不使用Cache。协处理器接口为外部协处理器提供了一个高效率的接口。龙芯一号CPU IP核提供了两套可配置的处理器总线接口:AMBA接口和哈佛结构SRAM接口。

龙芯二号

(英文名称Godson-2)

龙芯二号CPU 采用先进的四发射超标量超流水结构,片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.最高频率为1000MHz,功耗为3-5瓦,远远低于国外同类芯片,其SPEC CPU2000测试程序的实测性能是1.3GHz的威盛处理器的2-3倍,已达到中等Pentium4水平。

龙芯三号

龙芯

(英文名称Godson-3)

龙芯3A的工作频率为900MHz~1GHz,功耗约15W,频率为1GHz时双精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次。龙芯3A采用意法半导体公司(STMicro)65纳米CMOS工艺生产,晶体管数目达4.25亿个,芯片采用BGA封装,引脚的数目为1121个,功耗小于15瓦。龙芯3A集成了四个64位超标量处理器核、4MB的二级Cache、两个DDR2/3内存控制器、两个高性能HyperTransport控制器、一个PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龙芯3A的指令系统与MIPS64兼容并通过指令扩展支持X86二进制翻译。

产品架构

架构

灵活的可配置IP核架构

Cache容量可配置

0/4K/8K/16K I/D Cache

TLB形式可配置

接口

可配置接口

AMBA 2.0 full compatible

龙芯

Direct RAM (Harvard Structure)

MIPS SYSAD

Co-processor Intelface

内外时钟关系可配置

IEEE754兼容FPU可配置

MMX部件可配置

EJTAG接口,便于SOC调试

功耗

具体配置相关,Typical::1~2 mW/MHz

面积

与具体配置相关,Min:1.0mm2 (软IP)

友好的IP用户接口

可视化配置界面

完全可综合的IP,可无缝衔接主流EDA工具

集成synthesis环境

verilog仿真模型

IP Modeling

ISS仿真器

SoC硬件验证平台

SoC系统虚拟开发平台

软/硬IP

IP抽象模型提取,提供工业格式文件

硬IP的实现(0.18微米/0.13微米工艺)

IP架构

增强可配置灵活性

在面积、功耗上持续优化

针对应用不断增强处理能力(加密安全,控制,JAVA)

增加对多核的支持

SOC开发平台

提供基于EJTAG的IDE

提供ISS用于性能评估

系统

硬件开发板

操作系统

Linux

OpenBSD (N64 ABI)

VxWorks

WinCE

软件支持

XFree86-4.1.0 X Server

Mozilla Browser,Apache WEB server

Compiler:GCC,F77

Word processing,video server

Virtual Terminal for X and Wind

产品介绍

龙芯1号

龙芯1号(英文名称Godson-1)于2002年研发完成,32位,主频 266 MHz。

龙芯1D

龙芯1D于2012年6月完成设计并进入流片状态,是专门为超声波热量表定制的高精度、低功耗测量SoC。

龙芯1D集成的时间数字转换器设计测量分辨率可达15ps,能够检测极其微小的流量变化。在电源管理方面,龙芯1D包含11个电源域,可将待机电流控制在10uA以下。测量过程的软硬件协同设计使得龙芯1D在热量表中用一个电池能工作五年以上。

除了热量表,龙芯1D还可以应用在水表、激光测距、重量测量等场合,是一个非常值得期待的产品。

最初版本

龙芯2号(英文名称Godson-2)于2003年正式完成并发布。

龙芯2号是64位处理器,主频为300MHz至1000MHz,500MHz版约与1GHz版的Intel Pentium III、Pentium 4拥有相近的效能水平。

龙芯2号最初的版本是用0.13微米工艺,往后也会使用更精细的工艺。事实上龙芯2号当称为一个系列,过程中经过数次改进,已知的有2、2A、2B、2C、2E、2F等型号,龙芯2号处理器已用于黄羊河公司(YellowSheepRiver,简称:YSR)的低价型Linux台式机:Municator中,最初的售价约为1200元人民币。其电脑皆曾在2006 年3月德国汉诺威CeBIT及6月的台北国际电脑展览会中展出。

龙芯2E

2006年6月,龙芯2E继成功在法国流片成功后,全世界排名第五位的集成电路生产商--意法半导体公司与中科院计算所签订技术许可协议,购买龙芯2E的生产和全球销售权。意法半导体计划每年销售龙芯芯片1000万片以上。

2006年9月13日,中国科学家宣布研制成功通用中央处理器芯片龙芯2E。它是一款采用64位MIPSⅢ指令集的RISC处理器,采用90纳米的CMOS工艺,晶体管数目是4700万个,芯片面积是6.8mm×5.2mm。最高主频达到1.0GHz,一般频率是800MHz,功耗大约是5-7瓦。实际运行频率定于660MHz。规格方面,龙芯2E处理器有128KB一级缓存、512KB二级缓存。性能方面,它的单精度浮点运算速度是每秒80亿次,双精度浮点运算速度是每秒40亿次。龙芯2E在1.0GHz主频下,SPEC CPU2000的得分为500分,综合性能达到Pentium III和Pentium 4的水平。

龙芯2F

龙芯2F与龙芯2E相比,主要有以下几个方面的提高。一是主频提高30%以上,通过频率筛选,将有1GHz以上的产品。二是相同频率下功耗降低40%左右,并增加了很多诸如降频、温度传感器、关闭L2等功耗管理功能。三是集成了更多的系统功能,除了CPU外,还集成了DDR2内存控制器、66MHz PCI/100MHz PCIX控制器、Local IO控制器、GPIO、中断控制器、DMA控制器、部分显示加速等功能,将大幅度降低系统成本。四是封装更小,龙芯2E的封装为35mm*35mm,龙芯2F为27mm*27mm。五是可测性设计(DFT)和可生产性设计(DFM)有明显提高,因此可以降低芯片成本。

龙芯2G

龙芯2G在设计规格上相当于龙芯3A的单核版。与上一代龙芯2F相比,在二级缓存容量、IO总线带宽,配套桥片性能上都有大幅提升。龙芯2G在1GHz情况下运行稳定,可提供更好地用户体验,并适用于笔记本电脑与瘦客户机等移动与桌面市场。

龙芯2H

龙芯2H已于2012年底完成了流片,64nm工艺,它在一个芯片中集成了CPU,GPU,北桥芯片,南桥芯片,内存控制器,显卡,网卡,声卡,USB模块等各种IO接口。芯片高度SOC设计,最大功耗为4W,主频1GHz,是龙芯家族中集成度最高的芯片。主要面向移动终端,笔记本电脑,平板电脑等移动处理器。

龙芯3A

龙芯L3A02

中国第一个具有完全自主知识产权的四核CPU,龙芯3号处理器采用的是65nm(纳米)工艺,主频1GHz,晶体管数目4.25亿个,单颗龙芯3A的最大功耗为15W,理论峰值为16Gflops,每颗CPU单瓦特能效比1.06Gflops/W是X86 CPU的2倍以上,达到了世界先进水平。龙芯3号多核CPU系列产品定位服务器和高性能计算机应用。

龙芯3A集成了四个64位超标量处理器核、4MB的二级内存、两个DDR2/3内存控制器、两个高性能HyperTransport控制器、一个PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龙芯3A的指令系统与MIPS64兼容并通过指令扩展支持X86二进制翻译。

龙芯3B

继龙芯3A后,龙芯3号系列处理器的第二代产品——8核龙芯3B处理器已于2012年年初流片成功。龙芯公司相关部门正在对该款芯片做进一步的开发和测试工作。预计2012年夏天实现量产。

龙芯3B仍采用65纳米生产工艺,在单个芯片上集成8个增强型龙芯GS464处理器核,它可以与MIPS64兼容,并支持X86虚拟机和向量扩展。在1G主频下可实现128G flops的运算能力。在存储设计方面,龙芯3B最多可同时处理64个访问请求,可提供12.8GB/S的访存带宽。在I/O接口方面,龙芯3B实现2个16位的HyperTransport接口,可提供高达12.8GB/S的IO吞吐能力。八核龙芯3号的芯片对外接口与四核龙芯3号完全一致,两款芯片引脚完全兼容,可实现无缝更换。

我国首台采用自主设计的“龙芯3B”八核处理器的万亿次高性能计算机“KD-90”,由中国科学技术大学与深圳大学联合研制成功。

高性能计算机KD-90采用单一机箱,集成了10颗八核龙芯3B处理器,理论峰值计算能力达到每秒1万亿次。系统硬件由1个前置服务器、5个计算节点、2个千兆以太网交换机以及监控单元组成。其中,前置服务器和计算节点均采用了我国自主设计的龙芯3B八核处理器,主要互连部件采用了自主研发的超多端口千兆以太网交换芯片。系统软件以开源软件为主,其中包括针对龙芯3B处理器结构专门优化的数学函数库,以及自主研发的图形化系统监控管理软件,具有兼容性强、易维护、易升级、易使用等特点。

龙芯

KD-90的研制依托国家科技重大专项“高性能多核CPU研发与应用”项目的支持,由中科院院士、中国科技大学教授陈国良为负责人的科研团队,历时近一年攻关成功。与基上一代“龙芯”处理器的国产高性能计算机KD-60相比,KD-90系统实现了“三低一高”的特性:成本低于20万元,功耗低于900W,体积降低至0.12平方米,性能高达每秒1万亿次。

以中科院院士陆汝钤为组长的专家组鉴定后认为,KD-90是我国高性能计算机国产化的又一次重要突破,在编程模型和互联网络等关键技术上达到了世界先进水平。适用于高性能计算教学、大规模科学与工程计算,以及军事科学、国家安全和国民经济建设等领域,应用前景广阔。

龙芯3B1500

在核高基项目支持下,龙芯3B 1500处理器流片成功。龙芯3B 1500集成8核向量处理器,32纳米工艺,主频1.3—1.5GHz,硅片面积182.5mm2,支持1.15v-1.3v变压和动态变频。龙芯3B 1500结构及封装引脚基本兼容龙芯3B 1000,性能较龙芯四核3A处理器大幅提升。龙芯3B 1500流片成功,标志着核高基支持任务的技术指标全面完成。

龙芯规格

龙芯1A

主频300MHz
微体系结构集成32位超标量处理器核,该处理器核具有如下特点:支持MIPS 32指令集;5级流水线结构;双发射乱序执行结构;1个定点单元、1个浮点单元和1个访存单元;采用交叉开关和多级AMBA总线桥进行片内的互连
高速缓存一级指令cache和数据cache各16KB
内存控制器1个32 /16位DDR2-333控制器
音视频支持1920*1080/60fps的LCD+VGA控制器;AC97音频控制器;333控制器
I/OUSB2.0/1.1 *4;SATA2*2;GMAC*2;PCI Host/Device、 LPC、I2C、CAN;SPI、NAND;UART*4、RTC、PWM、GPIO*88 等I/O控制器
展开表格

龙芯1B

主频200MHz
微体系结构集成32位超标量处理器核,该处理器核具有如下特点:支持MIPS 32指令集;5级流水线结构;双发射乱序执行结构;1个定点单元和1个访存单元;采用交叉开关和多级AMBA总线桥进行片内的互连
高速缓存一级指令cache和数据cache各8KB
内存控制器1个32 /16位DDR2-266控制器
音视频支持1920*1080/60fps的LCD控制器;AC97音频控制器
I/OUSB2.0/1.1 *1;GMAC*2;I2C、CAN;SPI、NAND;UART*12、RTC、PWM、GPIO*62 等I/O控制器
展开表格

龙芯2F

主频800MHz
微体系结构集成64位超标量处理器核,该处理器核具有如下特点:支持MIPS III指令集;9级超流水线结构;四发射乱序执行结构;2个定点单元、2个浮点单元和1个访存单元
高速缓存一级指令cache和数据cache各64KB;二级cache 512KB
内存控制器集成72位DDR1/2-667控制器,支持ECC校验
高速I/O
其它I/O集成PCI、Local IO、GPIO等I/O控制器
展开表格

龙芯2G

主频900MHz-1GHz
微体系结构集成3-4个64位超标量处理器核,采用交叉开关进行核间互连
高速缓存每个处理器核的一级指令cache和数据cache各64KB多个处理器核通过交叉开关共享4MB的二级cache
内存控制器集成两个64位DDR2/3-800控制器
高速I/O集成一个HyperTransport控制器,带宽达到6.4GB/s
其它I/O集成LPC、SPI、UART、GPIO等I/O控制器
展开表格

龙芯3A

主频1GHz
微体系结构集成4个64位超标量处理器核,采用交叉开关进行核间互连;通过HT接口进行片间可伸缩互连
高速缓存每个处理器核的一级指令cache和数据cache各64KB四个处理器核通过交叉开关共享4MB的二级cache
内存控制器集成两个72位DDR2/3-800控制器,支持ECC校验
高速I/O集成两个HyperTransport控制器,带宽达到12.8GB/s,支持两个处理器无缝互连
其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器
展开表格

龙芯3B

龙芯3B主要用于高性能计算机、高性能服务器、数字信号处理等领域。

主频1GHz
微体系结构集成8个64位超标量处理器核,通过HT接口进行片间可伸缩互连
高速缓存每个处理器核的一级指令cache和数据cache各64KB八个处理器核通过交叉开关共享4MB的二级cache
内存控制器集成两个DDR2/3-800控制器
高速I/O集成两个HyperTransport控制器,带宽达到12.8GB/s,支持多个处理器无缝互连
其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器
展开表格

龙芯3B1500

龙芯3B1500是国产商用32纳米8核处理器,最高主频可达1.5GHz,支持向量运算加速,最高峰值计算能力达到192GFLOPS,具有很高的性能功耗比。龙芯3B1500主要用于高端桌面计算机、高性能计算机、高性能服务器、数字信号处理等领域。

主频1.2GHz-1.5GHz
微体系结构集成8个64位超标量处理器核,每个处理器核具有如下特点:  支持MIPS64指令集及龙芯扩展指令集;  9级超流水线结构;  四发射乱序执行结构;  2个定点单元、2个浮点单元和1个访存单元;  每个浮点单元支持256位向量运算;  采用交叉开关进行核间互连;  通过HT接口进行片间可伸缩互连
高速缓存64KB私有一级指令cache和数据cache  128KB私有二级cache  8个处理器核共享8MB的三级cache
内存控制器集成两个72位DDR2/3控制器,支持ECC校验
高速I/O集成两个HyperTransport2.0控制器
其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器
展开表格

衍生产品

迷你计算机

龙芯

福珑2E迷你电脑:基于国产龙芯处理器的这种主机尺寸不到普通PC的十分之一,仅与普通电脑光驱相当。采用中科院计算所研制的龙芯-2E处理器(主频:666MHz),默认配有256M内存,40G的笔记本硬盘,ATI RADEON 7000-M。在接口方面,福珑迷你电脑也比较齐备,配备有显示器和COM接口,音频输入输出接口,一个用于连接鼠标或键盘的PS2口,以及4个USB接口,可满足常用外设的接入。此外,福珑迷你电脑还配有台式机不常见的红外线接口和可输出到电视机的S端子,可通过内置的软件,使用遥控器操作在电视上播放媒体文件,其功能相当于普通机顶盒。考虑到体积的因素,此款电脑没有预置光驱,但用户可选配USB光驱。[9]

小巧玲珑的龙芯II福珑迷你电脑,而这台电脑满负载功率也不超过20W。搭配可自由定制的开源Linux操作系统。

龙芯

福珑2F迷你电脑:采用全金属外壳机箱,设计新颖且小巧轻便。内置我国拥有自主知识产权的龙芯2F高性能处理器,并搭配可自由定制的开源Linux操作系统。福珑2F迷你电脑2F6003,内置64位低功耗新一代龙芯2F处理器。据中科龙梦知情人士透露,此次推出的福珑2F迷你电脑为此前2F6002的升级版,增加了一些DVI接口。2F6002曾于4月15日上市,官方指导价为每台1800元。[10]迷你笔记本

龙芯

龙梦“逸珑”笔记本采用了龙芯2F CPU、8.9寸LCD显示屏、集成WIFI无线网络、摄像头,带多种接口和读卡器。存储器为160G SATA硬盘或4G SSD硬盘可选,重量约1KG。主要特点是小巧便携,绿色节能、架构开放自由,系统稳定安全,易于管理。属于便携式笔记本或上网笔记本一类的产品。适合于无线商务、移动办公、旅游、教育等应用。

龙芯俱乐部与龙芯笔记本官方厂家中科梦兰公司独家合作,面向龙芯爱好者、开源社区、Linux用户和开发者推出龙芯笔记本开源社区团购活动。参加龙芯笔记本开源社区团购活动者可以与市价相比最低1折的价格购得龙芯笔记本。

性能参数

逸珑迷你笔记本

产品型号81018089B8089A8089D
处理器Loongson 2F,主频800-900MHz
主板芯片组集成北桥+AMD CS5536
显卡SM712独立显卡
存储内存DDRⅡ1GDDRⅡ 512MDDRⅡ 1G
展开表格便携式笔记本

外观

2012年8月7日龙芯产业化公司龙芯梦兰网站显示,一款型 号为逸珑8133便携式笔记本即将上市销售。这款产品给予龙芯3A的四核处理器,主频为900MHz,操作系统支持红旗、中标麒麟、中科方德、共创、Debian Linux等。正式发售版的逸珑8133将预装国产办公软件。

逸珑8133便携式笔记本模具和配色类似苹果的MacBook Pro,但转轴部分有所改进。知情人士透露,这款产品的最终售价将会在4000元左右,比MacBook Pro便宜了不少。如果批量购买五台以上,将会略低于这个价格,或为3998元。

据介绍,该产品搭载的龙芯3A处理器是龙芯系列产品中最高端的产品,拥有四个核心,每颗核心的主频为900MHz~1GHz。处理器采用意法半导体公司(STMicro)65纳米CMOS工艺,热设计功耗15W。

灵珑一体机

产品型号9S1A9S2A9S3A9S5A
处理器Loongson 2F,主频800MHz
主板芯片组集成北桥+AMD CS5536
显卡XGI V2图形处理器,32MB显存
存储内存DDRⅡ 512MB
展开表格

红日3A服务器

采用我国拥有自主知识产权的loongson3A四核高性能处理器,集搭载中科梦兰自主设计Mini-ITX规格主板,可内置可信TCM模块,兼容国产基础软件系统,可广泛应用于综合门户网站的内容频道;网络视频;博客;即时通信;社区网站的个人空间;企业网盘等不同领域。

性能参数

处理器1LoongSon3A(Qual-Core)单核900MHz-1GHz
处理器2LoongSon3A(Qual-Core)单核900MHz-1GHz
芯片组AMDRS780E+SB710,集成ATIRadeonHD3200显卡,独立显存1Gb,可最大共享系统内存至256MB
VGA最大分辨率2560x1440@75Hz
网络内置双网卡,Intel10/100/1000M自适应网卡
扩展8条DDR3DIMM(最大支持2GBx8)
展开表格

最小体积全自主计算机--曙光龙腾L200

龙芯

在“863”计划和“核高基”的专项支持下,曙光公司成功研制出基于国产龙芯处理器的最小体积全自主知识产权计算机——曙光龙腾L200。

L200是曙光公司最新推出的一款面向桌面应用的单路计算机,采用中国独立自主研制的龙芯3A四核/3B六核处理器。该产品支持中标麒麟、中科方德等国产桌面操作系统,从基础架构到操作系统软件都具有完全自主知识产权。由于L200搭配的是全国产操作系统,因此能够和国内的office软件、数据库软件、中间件软件实现兼容,结合其自身节能等优点,能够显著提高桌面计算机的可用性和易用性,最大限度地降低IT运营和管理维护成本,完全能够满足日常办公需求。

据了解,曙光L200是中国体积最小的计算机,高30cm,正面宽度为9cm,长为32.6cm,重量仅3.5公斤。

开发板

龙芯

开龙主板的一大特色是同时支持多个开源硬件扩展接口,可以使用Arduino、Microduino和XBee扩展模块,最大限度的利用已有的开源硬件资源。开龙主板的宗旨是“做最开源的开发板”,所以正式版发布的时候,硬件PCB设计和软件代码全部开源,毫无保留,任何个人和单位都可以不受限制的使用和再发布。开龙主板与现有的“树莓派”、Arduino相比,在实现一些功能如:网络摄像头、接入互联网、无线网关等方面的总体成本更低,性价比高,有利于普及推广,很适合创客和教育教学的使用,也可以作为智能硬件创业团队的原型开发板。

开龙主板充分支持多种无线网络,包括蓝牙、Zigbee、WIFI、GPS、GPRS、NFC等等,将用于进行智能家居无线网关、3D网络打印机、网络摄像头等项目开发。龙芯俱乐部和开源龙芯技术社区负责人石南表示:开龙主板项目已经和国内开源硬件团队Microduino进行合作,推广各种采用开龙主板和Microduino模块组合应用的方案。开龙主板还与国内物联网平台machtalk合作,联网即可自动接入物联网数据中心,实现远程数据采集和远程控制等功能。[11]

产品意义

有了龙芯,我们可以开发自己的服务器、路由器,甚至军工产品。

世界工厂的困惑

众所周知,中国已经成为名副其实的“世界工厂”,到过“珠三角”、“长三角”的读者,特别是在此两地工厂工作过的应该有切身感受。众多外资企业将生产过程的低端部分----主要是加工和组装环节转移到中国,这些低端环节耗费劳动力多,劳动强度大,但附加值很低。

电脑业界赫赫有名的罗技鼠标,生产工厂设在苏州,每年向美国运送2000万个贴着“中国制造”标签的鼠标,每只在美国的售价约为40美元。在这一价格中,罗技拿8美元,分销商和零售商拿15美元,另外14美元进入零部件供应商的腰包,中国从每只鼠标中仅能拿到3美元,而且工人工资、电力、交通和其他开支全都包括在这3美元里!

站在电子爱好者角度看,鼠标的制造有何难?难就难在罗技能将小小鼠标产业做得这么大,关键在于其知识产权和品牌。说得极端一点,小小的CPU芯片,动辄成百上千甚至上万元一颗,其主要材料无非是一点金属和可从沙子中提炼的硅,但是不掌握CPU设计技术、芯片制造技术,我们又能有何选择?

对PC产业来讲,包括联想、方正这样的大企业利润也是相当低的,主要原因就是我们买别人的芯片来组装,只是一个组装工厂而已。而且,在国际CPU巨头AMD与英特尔的明争暗斗中,中国PC厂商无论怎样都掩盖不了“看他人脸色”的尴尬处境,既要哄着占有份额优势的英特尔,又不敢得罪价格占优的AMD,而这一切都缘于我们无“芯”可挑大梁,缘于中国PC业长期以来没有占据技术的制高点。

“龙芯”的市场前景

进口一颗服务器用的CPU芯片(至强MP)价格高达几万元,占到服务器成本的70%以上,据统计,光进口芯片国外大公司每年就能从中国赚走一百多亿美元。如果“龙芯”可以替代,市场前景不可限量。

为了促使“龙芯”能尽快得到整机制造企业和系统设计企业的应用,使其顺利进入产业链,促进产业化,国内MII-MS嵌入式软件实验室为“龙芯二号”CPU开发面向的BSP软件支持包,使“龙芯”能支持微软公司的Windows CE这一嵌入式操作系统。“龙芯2号”电脑亮相国际市场,基于Linux,含40GB硬盘、256MB内存,具有上网、收发邮件、办公文本处理、音视频播放等基本功能,相当于1GHz的奔3台式机,售价仅150美元。但仅仅只有低价是不够的。CPU的产业链非常长,并不是说做出了一个产品马上就可以形成一个产业,就能够大量的卖出去。它需要操作系统、应用软件、硬件设计的配合。产业化的主要手段就是建立产业联盟,在北京有龙芯公司,在重庆、江苏、广东等地都有“龙芯“的基地。“龙芯”的应用不仅仅限于电脑,对国防工业,网络服务器、路由器、游戏机,特别在中国广大的消费市场有着广阔的发展前景。

龙芯让人人都用得起电脑,当初龙芯一个研发宗旨是信息化要为广大人群服务,因此龙芯一直注重在低成本方面的突破。虽然电脑价格越来越低,但是对于广大的中国市场来说,仍然太贵,特别是农村和西部市场。龙芯电脑的推出为填平数字鸿沟提供了可能性,有广阔的前景。

研发

保卫国家信息安全的必经之路

在如今的芯片市场上,国际巨头垄断,自主研发可谓困难重重。胡伟武告诉记者,研发“龙芯”的初衷就是要打破国际垄断。

在胡伟武看来,高性能通用CPU不是一般的集成电路,它是信息产业的基础部件,也是武器装备的核心器件。它对国家安全都有着极其重要的战略意义。可是,当前国际的芯片市场受到重重垄断,包括技术垄断、知识产权垄断、市场垄断等等。

“我们面临的状况和老一辈科学家创造两弹一星时有所不同:那个时候我们是在封锁的情况下打破封锁,而我们是在开放的情况下打破垄断。”胡伟武向记者分析道。

据记者了解,龙芯项目最初由中国科学院发起,而这个项目发起的初衷就是要面向国家战略需求、面向国际科技的前沿。因此,龙芯的诞生就是要保障国家信息安全、支撑信息产业的发展。

缺乏信心成最大难题

所谓的“缺乏信心”并不是龙芯研发团队的自信缺失,而是在国际巨头只手遮天的产业形势下,外界舆论所表现出的对龙芯的信心不足。

胡伟武在采访中告诉记者,几年来,龙芯发展的过程可以分为不同的阶段。每个阶段,龙芯所面对的困难在都各有不同,但贯穿始终的最大困难就是外界对龙芯研发的质疑态度——

2001年到2002年是龙芯从无到有的阶段。那个时候,可以说,我国业界对芯片技术一无所知,而且没有人可以请教,一切都要从零开始。当时,胡伟武带领团队成员去国外请专家、请老师授课。这一时期,很多人都质疑中国到底要不要自己做芯片——国外大企业每年投入几十亿美元,有几千人的研发队伍,而龙芯研发团队只有几十人,经费也只有几千万而已,如何做出高性能CPU呢?直到龙芯一号诞生,胡伟武和他的团队采用用事实证明了中国人有能力做自己的通用CPU。

第二个阶段,是从2003年到2005年,这是个技术持续追赶的阶段。虽然龙芯已经解决了能不能做、要不要做的问题,但当时龙芯芯片的各方面性能还都与国际水平相去甚远。所以,又有很多人跳出来质疑龙芯能不能做好?“屋漏偏逢连夜雨”:恰好2004--2005年间又发生了“汉芯”造假事件。于是,舆论导向也就看似很“自然”地开始怀疑龙芯是假的了。

而实际上,龙芯从2003年到2005年,经历3年的时间,平均每年性能提高3倍,到“十五”末的时候达到当时中低档国际主流芯片的性能,做到初步可用。打赢了“能不能做好”这场“战役”。

初步涉水产业化进程

第三个阶段,是从2006年到2009年。这3年,是龙芯芯片技术进一步改进和产业化探索的阶段。尽管在技术上取得了突破、在部分性能指标上也已经达到了世界先进水平,但是龙芯产品是不是能卖得出去、有没有用,又成为了摆在龙芯人面前的又一难题。

胡伟武认为,龙芯的产业化,不是传统意义上一个产品的产业化,也不是一条产业链的建设,而是自主可控的信息产业体系的建设。在这方面,当时还没有任何经验。

据了解,解放初期,国家通过政策性规划完成了工业产业体系的建设。但在市场如此开放的,以企业为主体来建设一个产业体系,龙芯还是第一个。当时,龙芯用了几年的时间在江苏建立了产业基地,尝试与一些企业合作逐渐掌握市场运行的规律,积累经验,在一些行业和领域也取得了很多突破。例如,2009年年底江苏省政府采购了15万套龙芯笔记本,已经成功地在江苏省中小学完成了6万套的布点。

从2010年起,龙芯正式以公司的形式运行,开始了正真正意义上的规模产业化发展。这个阶段,龙芯能不能走向规模产业化又成了外界舆论最大的疑虑。当然,这个问题也得通过实践来回答。而对于龙芯来说,这个阶段最大的困难便是科研与应用如何良好的结合。

龙芯产业化影响深远

胡伟武说,龙芯芯片的研发成功在我国计算机发展史上具有里程碑式的意义,是我国研制自主知识产权的高性能通用CPU的典范之作,将为国家安全和国防事业发挥重大的、不可替代的作用。

首先,龙芯的研发成功是增强了国人的自信心,向世界证明了中国人也可以自己做芯片。龙芯已经被写入九年制义务教育的教科书,记录了龙芯历史性贡献。另外,龙芯也被写入普通高等教育《大学计算机基础》教材,在讲计算机文化时,龙芯已经和Intel一样,成为了授课内容。

其次,龙芯对于国家安全保障的作用也得到了充分体现。龙芯开始进行产业化伊始,就面向国家的信息安全需要,这是龙芯最根本的使命。到为止,龙芯在安全领域的应用已经全面展开。

再其次,是龙芯对整个信息产业的支撑作用。通用CPU就好比工业的钢铁、石油。没有钢铁和石油,工业就谈不上存在。信息产业也一样——没有自主的CPU,就谈不上信息产业体系。但是,CPU与钢铁、石油还有不同之处,就在于它的创新性要求很强。而且,它是一个很庞大的体系。另外,CPU非常依赖产业内的“生态环境”,同时又可以控制这个“生态环境”。如今,我国80%的信息产业都是建立在他人的芯片平台基础上的,而龙芯的诞生,特别是龙芯正在进行的规模产业化的建设,将为我国自主可控的信息产业发展起到了强有力的支撑作用。

未来展望

中国工程院院士、联想汉卡发明人倪光南指出:IT核心技术的掌握关系到国家的信息安全,因此,IT核心技术中国非做不可。

一位网友在搜狐博客网上这样写到:很希望看到中国自己的CPU,不管它的性能怎样,只要它上市,我就会买。身为开发人员,能够深深地理解作为中国的开发人员所担负的历史责任。虽然没有机会加入到CPU的开发中,那就在他们辛勤工作的时候默默支持吧!多么朴实的言语,但展现的却是国人高昂的爱国激情!

“龙芯”的问世不仅仅在于中国自主研发出了自己的CPU产品,其更深层次的意义在于它穿透了困扰在中国科技人员心中的一团迷雾,凭借着自身的技术研发实力,中国同样可以自己研发生产出被国外垄断的产品。有不少年轻人,对国货表现出一贯的不信任,尤其数码产品等。日本人就很善于引进外国技术,然后学习、模仿、创新,中国人同样也有这种精神。中国既然可以在艰难条件下研发两弹一星,在航天领域与美国、欧洲并肩前进,那么在芯片研制领域也一定可以做到!

“龙芯”是我们自己的孩子,我们要用心去爱护他。虽然他还不如Intel,但至少还没有几个国家能够生产出这种暂时不如Intel的芯片!这就是我们的骄傲!回想霍元甲时代,作为香港特区一位电子工作者,笔者再次感慨万千。我们是龙的传人,坚信“龙芯”的成功是必然的!我们期待着“龙芯”带给我们更多、更大的惊喜![4]