MLU220产品简介

MLU220-M.2边缘智能加速卡产品手册

1. 前言

1.1. 版权声明

免责声明

北京中科寒武纪科技公司(下称“寒武纪”)不代表、担保(明示、暗示或法定的)或保证本文件所含信息,并明示放弃对可销售性、所有权、不侵犯知识产权或特定目的适用性做出任何和所有暗示担保,且寒武纪不承担因应用或使用任何产品或服务而产生的任何责任。寒武纪不应对因下列原因产生的任何违约、损害赔偿、成本或问题承担任何责任:(1)使用寒武纪产品的任何方式违背本指南;或(2)客户产品设计。

责任限制

在任何情况下,寒武纪都不对因使用或无法使用本指南而导致的任何损害(包括但不限于利润损失、业务中断和信息损失等损害)承担责任,即便寒武纪已被告知可能遭受该等损害。尽管客户可能因任何理由遭受任何损害,根据寒武纪的产品销售条款与条件,寒武纪为本指南所述产品对客户承担的总共和累计责任应受到限制。    

信息准确性

本文件提供的信息属于寒武纪所有,且寒武纪保留不经通知随时对本文件信息或对任何产品和服务做出任何更改的权利。本指南所含信息和本指南所引用寒武纪文档的所有其他信息均“按原样”提供。寒武纪不担保信息、文本、图案、链接或本指南内所含其他项目的准确性或完整性。寒武纪可不经通知随时对本指南或本指南所述产品做出更改,但不承诺更新本指南。

本指南列出的性能测试和等级要使用特定芯片或计算机系统或组件来测量。经该等测试,本指南所示结果反映了寒武纪产品的大概性能。系统硬件或软件设计或配置的任何不同会影响实际性能。如上所述,寒武纪不代表、担保或保证本指南所述产品将适用于任何特定用途。寒武纪不代表或担保测试每种产品的所有参数。客户全权承担确保产品适合并适用于客户计划的应用以及对应用程序进行必要测试的责任,以期避免应用程序或产品的默认情况。

客户产品设计的脆弱性会影响寒武纪产品的质量和可靠性并导致超出本指南范围的额外或不同的情况和/或要求。

知识产权通知

寒武纪和寒武纪的标志是寒武纪科技公司在美国和其他国家的商标和/或注册商标。其他公司和产品名称应为与其关联的各自公司的商标。

本指南为版权所有并受全世界版权法律和条约条款的保护。未经寒武纪的事先书面许可,不可以任何方式复制、重制、修改、出版、上传、发布、传输或分发本指南。除了客户使用本指南信息和产品的权利,根据本指南,寒武纪不授予其他任何明示或暗示的权利或许可。未免疑义,寒武纪不根据任何专利、版权、商标、商业秘密或任何其他寒武纪的知识产权或所有权对客户授予任何(明示或暗示的)权利或许可。

版权声明

© 寒武纪科技公司保留一切权利。

 

1.2. 版本记录

表1. 1版本记录

文档名称

思元220智能处理卡产品手册

版本号

V1.0.0

作者

Cambricon

创建日期

2020年7月17日

 

1.3. 更新历史

V0.5.0

更新时间:2019.11.1

更新内容:

  • 初始版本

V0.6.0

更新时间:2019.12.9

更新内容:

  • 更新电源设计要求和散热要求

V0.7.0

更新时间:2020.4.7

更新内容:

  • 更新结构尺寸、散热规格、包装尺寸和重量章节

V0.8.0

更新时间:2020.4.23

更新内容:

  • 全文MLU220智能处理卡更新为思元220 M.2边缘智能加速卡
  • 增加2金手指信号定义
  • 更新MTBF内容
  • 增加订购指南

V0.8.1

更新时间:2020.4.24

更新内容:

  • 更新附录表 1 Socket2 B+M key Card Edge信号定义

V0.8.2

更新时间:2020.5.6

更新内容:

  • 更新图2、图3.3、表3.7和表5.1,更新3.4

V1.0.0

更新时间:2020.7.17

更新内容:

  • 更新到0.0版本;删除产品编码,直接使用销售型号;更改BAR空间;增加高温性能说明;更改3.1 Wake信号异议部分

 

2. 概述

图2. 1思元220 M.2边缘智能加速卡示意图

 

寒武纪思元220 M.2边缘智能加速卡是寒武纪推出的第一款边缘加速卡产品,搭载了寒武纪思元220芯片,为边缘推理提供强大的智能算力支撑。思元220 M.2边缘智能加速卡在尺寸为U盘大小的卡片上实现了8TOPS(INT8)的算力,典型功耗仅为8.25W。相比于传统架构智能处理器,可获得巨大的性能功耗比提升。思元220 M.2边缘智能加速卡内置4GB的LPDDR4X内存容量,支持被动散热方式。用户可通过M.2标准B+M Key槽位快速部署到已有的业务中实现业务的智能升级和边缘加速解决方案。

3. 产品规格

3.1. 硬件规格

表3. 1详细描述了思元220 M.2边缘智能加速卡硬件规格。

 

表3. 1思元220 M.2边缘智能加速卡硬件规格

产品型号

MLU220 M.2

板卡尺寸

长:80mm

宽:22mm

PCB厚度:0.8mm

接口形式

M.2 B+M key PCIE GEN3 X2

内存容量

4GB (2颗16Gb LPDDR4X)

内存位宽

64bit

内存接口频率

最大支持3733Mb/s

PCIe ID

(EP模式)

Device ID:0x0220

Vendor ID:0xCABC

Sub-Vendor ID:0xCABC

Sub-System ID:0x0033

SMBus地址

0x8E(write),0x8F(read)

供电电源

金手指3.3V

典型功耗

8.25W (3.3V 2.5A)

FLASH

16MB

散热方式

被动散热

板卡壳温

-20℃-80℃

储存环境

-25℃—85℃

MTBF

2000k hours at 35℃

(根据Telcordia SR-332 Issue3计算值)

板卡认证

CE-ROHS,VCCI,BSMI

板卡重量

50g

备注:MLU220 M.2不支持Wake唤醒功能;MLU220 M.2不支持Alert功能。

 

3.2. 软件规格

表3. 2详细描述了思元220 M.2边缘智能加速卡的软件规格。

 

表3. 2 思元220 M.2边缘智能加速卡软件规格表

Base address

BAR0: 16MB prefetchable

BAR2: 32MB prefetchable

BAR4: 2MB prefetchable

ECC保护

不支持

SMBus(8bit 地址)

0x8E(write) Ox8F(read)

解码能力

支持16路 H264/H265 1080@30帧 解码

适配的操作系统

CentOS7.4&7.6

Ubuntu16.04&18.04

 

3.3. 结构尺寸规格

思元220 M.2边缘智能加速卡的结构外形如图3. 1所示,分为带散热器和不带散热器2种类型。

图3. 1思元220 M.2边缘智能加速卡结构外形图

 

思元220 M.2边缘智能加速卡的结构尺寸如图3. 2和图3. 3所示,用户在使用过程中需参考结构尺寸及3D模型,结合实际产品需求进行设计,以确保产品的适用性。

 

图3. 2思元220 M.2边缘智能加速卡结构尺寸图(带散热片,单位:mm)

 

图3. 3思元220 M.2边缘智能加速卡结构尺寸图(无散热片,单位:mm)

 

思元220 M.2边缘智能加速卡在用户使用场景说明,如图3. 4所示。

  • 用户PCB上Stand-off位置,要与2卡上固定孔位相匹配;
  • 用户PCB上对应2卡下方的位置,建议禁布,并保留与M.2卡底壳间的最小间隙≥0.1mm ;若无法实现禁布,须保证器件最高位置与底壳之间有足够的安全距离;
  • 推荐使用2及以上高度的M.2 Socket;
  • 2卡上盖预留有3颗M2.5深3mm的螺钉孔位,详细位置参考图3. 3,用于固定散热器,螺钉紧固力矩3.0kgf。

 

图3. 4思元220 M.2边缘智能加速卡使用场景示意图

 

3.4. 散热规格

用户在使用M.2边缘智能加速卡时,应设计完整的散热方案,包含散热器和风扇。M.2边缘智能加速卡的金属上壳应当通过导热材料与散热器充分接触,以保证M.2边缘智能加速卡工作在允许的温度条件下。思元220 M.2边缘智能加速卡的功耗和散热规格如下表3. 3所示:

 

表3. 3思元220 M.2边缘智能加速卡散热设计指标

Total Board TDP

8.25W

思元220芯片Shutdown温度

90℃

思元220芯片Slowdown温度

85℃

思元220芯片最大工作温度(Tj)

90℃

思元220芯片Slowdown降额

50%

思元220芯片最大工作壳温Tc

80℃

备注1:在高温下,MLU220 M.2板卡性能会有波动,详细内容参考《MLU220 M.2在高温场景性能波动说明》;

备注2:图3. 5为思元220 M.2边缘智能加速卡上对芯片结温Tj及M.2工作壳温Tc的定义,Tj是图示标示的①位置的温度,Tc是图示标示的②位置:

 

图3. 5模块散热结构示意图(②处为模块壳温Tc;①处为芯片结温Tj)

 

注意:

要求芯片工作的最高结温不超过90℃,且M.2边缘智能加速卡长期工作的结温不超过85℃,实际设计一定要优于此指标,此外工作壳温不得超过80℃。

请勿拆卸M.2边缘智能加速卡的金属部件,包括上壳、下壳、散热铜箔和散热器。散热部件一经拆除,导热材料不能重复使用。

M.2边缘智能加速卡主要是通过金属上壳散热,当其工作在较高的环境温度下或采用自然散热方式时,建议在底壳增加强化散热措施。如图3. 6所示。底部DDR的工作温度不超过85℃。

 

图3. 6思元220 M.2边缘智能加速卡在底壳增加强化散热措施

 

思元220 M.2边缘智能加速卡采用风冷散热,散热片尺寸如表3. 4所示。散热片存在两种不同进风方向,如图3. 7所示。对于不同的进风方式,给出了板卡散热器出风口处风量与环境温度的曲线关系,主机需要根据此曲线来调整风扇转速,保证板卡工作在绿色安全工作区域。当板卡温度超过85℃时,芯片降额50%;当板卡温度超过90℃时,板卡断电。

 

表3. 4 M.2 card散热片尺寸参数

总长

75.5mm

总宽

22mm

总高

14mm

底板厚度

2mm

齿厚

1mm

齿数

7片

齿间间隙

2.5mm

 

图3. 7 M.2边缘智能加速卡进风方向示意图

a) 从金手指侧进风

 

b) 从锁螺丝侧进风

 

在不同环境温度下,散热器出风口的风量要求见图3. 8,建议在“推荐使用环境条件”绿色安全区域内使用本产品。

 

图3. 8 M.2边缘智能加速卡风量需求曲线

a)从金手指侧进风时散热器出风口的风量需求

 

b)从锁螺丝侧进风时散热器出风口的风量需求

 

3.5. 电源接口规格

思元220 M.2边缘智能加速卡电源接口的输入电压和输入电流规范如表3. 5所示。

 

表3. 5思元220 M.2边缘智能加速卡需满足的供电电压波动范围

 

电压

平均电流(1s)

金手指3.3V

3.3V ± 5%

2.5A

 

思元220 M.2边缘智能加速卡输入为一路3.3V电源,最大瞬态电流为7A,需要母板电源模块供电能力超过7A。

 

表3. 6思元220 M.2边缘智能加速卡的峰值电流指标

 

最大电流(A)

时间

金手指3.3V

7

200us

5

1ms

4

5ms

 

3.6. 包装尺寸和重量

思元220 M.2边缘智能加速卡包装尺寸和重量信息如表3. 7所示。

 

表3. 7思元220 M.2边缘智能加速卡包装尺寸和重量

类型

重量

尺寸

备注

单卡

50g

80mm*22mm*21.2mm

NA

礼盒单卡

75g

112.2mm*58.5mm*24.5mm

每盒1张卡

工业整箱

5.5kg

402mm*262mm*168mm

每箱80张卡

备注:重量为实测值,公差+-10%

 

4. 软件环境

4.1. 软件环境

寒武纪提供软件开发环境Cambricon NeuWare

NeuWare全面支持各类主流编程框架(如TensorFlow、Caffe、Caffe2、MXNet和ONNX等)。用户可面向上述编程框架,便捷地在寒武纪思元220上开发和部署深度学习应用。同时,NeuWare提供了完整的运行时系统和驱动软件,方便系统快速集成。

NeuWare还提供了包括应用开发、功能调试、性能调优等在内的一系列工具。其中应用开发工具包括机器学习库、运行时库、编译器、模型重训练工具和特定领域(如视频分析领域)SDK等;功能调试工具可以满足编程框架、函数库等不同层次的调试需求;性能调优工具包括性能剖析工具和系统监控工具等。

 

5. 订购指南

5.1. 产品型号

思元220 M.2边缘智能加速卡有2种规格,如表5. 1所示。

 

表5. 1 思元220 M.2边缘智能加速卡规格

序号

销售型号

产品描述

备注

1

MLU220 M.2 with sink

MLU220_M.2_4GB_2.2x8

标准版

2

MLU220 M.2 without sink

MLU220_M.2_4GB_2.2x8(without sink)

无散热片版

 

如需详细了解,请访问 www.cambricon.com

电话:86-10-83030003

邮箱:business@cambricon.com

地址:北京市海淀区知春路7号致真大厦D座11层

 

 

附录

附录1:M.2金手指信号定义

思元220 M.2边缘智能加速卡采用B+M key金手指接口,接口结构说明如附录图 1和附录图 2所示,信号定义说明如附录表 1所示。

附录图 1 Card Edge Outline Top-side

 

附录图 2 Card Edge Outline Bottom-side

 

附录表 1 Socket2 B+M key Card Edge信号定义

Top-side

Bottom-side

Pin

Signal

备注

Pin

Signal

备注

75

CONFIG_2 = GND

AIC类型配置2

74

3.3V

3.3V电源

73

GND

 

72

3.3V

71

GND

 

70

3.3V

69

CONFIG_1 = NC

AIC类型配置1

68

 

 

67

NC

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

 

ADD-IN CARD KEY M

 

58

 

 

57

GND

 

56

 

 

55

REFCLKp

PCIe时钟,host输出给device

54

 

 

53

REFCLKn

52

CLKREQ#(I/O)(0/3.3V)

时钟请求信号

51

GND

 

50

PERST#(I)(0/3.3V)

复位信号

49

PERp0

PCIe数据,host输出给device

48

NC

 

47

PERn0

46

NC

 

45

GND

 

44

 

 

43

PETp0

PCIe数据,device输出给host

42

SMB_DATA(I/O)(0/1.8V)

SMB数据信号

41

PETn0

40

SMB_CLK(I/O)(0/1.8V)

SMB时钟信号

39

GND

 

38

NC

 

37

PERp1

PCIe数据,host输出给device

36

NC

 

35

PERn1

34

NC

 

33

GND

 

32

NC

 

31

PETp1

PCIe数据,device输出给host

30

NC

 

29

PETn1

28

NC

 

27

GND

 

26

NC

 

25

NC

 

24

NC

 

23

NC

 

22

NC

 

21

CONFIG_0=GND

AIC类型配置0

20

NC

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

 

ADD-IN CARD KEY B

 

11

NC

 

10

LED_1# (O)(OD)

LED指示信号

9

NC

 

8

NC

 

7

NC

 

6

NC

 

5

NC

 

4

3.3V

3.3V电源

3

GND

 

2

3.3V

1

CONFIG_3 = GND

AIC类型配置2

 

 

 

备注:更详细信息请参考《PCI Express M.2 Specification Revision 3.0, Version 1.2》标准。

 

思元220 M.2边缘智能加速卡Socket 2 CONFIG_0-3定义按照SSD-PCIE类别进行定义,关于Socket2支持的AIC卡参考表 1,更详细信息请参考《PCI Express M.2 Specification Revision 3.0, Version 1.2》标准。

 

表 1 Socket2 Add-in Card Configuration

参考资料:PCI Express M.2 Specification Revision 3.0, Version 1.2

 

MLU270-S4智能处理卡产品手册

版本记录

文档名称

MLU270-S4 智能处理卡产品手册

版本号

V1.01

创建日期

2020 年 8 月 10 日

更新历史

顺序

日期

版本号

说明

0

2019.07.03

V0.9

初版发行

1

2019.08.19

V0.91

Update Cambricon Neuware

2

2019.10.19

V0.92

Update Smbus 寄存器描述

3

2019.12.10

V1.00

正式版发布

4

2020.08.10

V1.01

更新smbus信息

服务联系: service@cambricon.com

www.cambricon.com

 

1. 概述

图 1 MLU270-S4智能处理卡示意图

 

为高能效比 AI 推理设计的 MLU270-S4 数据中心级加速卡

思元270芯片基于寒武纪在处理器架构领域的一系列创新性技术,最新的特性被集成在半高半长的标准 PCIe 尺寸的加速卡中,可以轻松搭载于最先进的人工智能服务器,实现 AI 推理计算力横向扩展。MLU270-S4加速卡功耗仅为70W,提供4倍于上一代加速芯片的计算力,可广泛支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,帮助 AI 推理平台实现超高能效比。

 

全新寒武纪 MLUv02 架构

MLUv02 架构不是简单的从上一代升级而来,新架构基于片上网络(NOC)构建,保证思元270内多达16个NPU集群的并行效率。基于硬件的片内数据压缩,提升缓存有效容量和带宽。新架构提供INT16,INT8,INT4,FP32,FP16的全面AI精度支持,满足多样化神经网络的计算力要求,通用、性能兼备。

 

推理性能再进一步

新架构在采用 INT8 精度进行 AI 推理计算时,非稀疏网络性能比第一代加速卡提升高达4倍,MLU270-S4可为系统提供40倍于CPU的超高能效比。其内置的全新硬件视频和图片编解码器,还可以在系统处理该类应用时,有效降低CPU前处理负载和PCIe带宽占用,帮助应用性能再进一步。

 

计算弹性和可编程

思元270芯片支持多类神经网络,寒武纪NeuWare软件栈可以轻松部署推理环境。BANG Lang.编程环境可对计算资源做直接定制,满足全多样化AI定制要求,专业而不专用。

 

2. 产品规格

2.1. 性能规格

表 1 详细描述了 MLU270-S4 智能处理卡的性能规格:

表格 1 PCIE加速卡硬件规格表

板卡类型

MLU270-S4

核心架构

Cambricon MLUv02

核心频率

1 GHz

整数运算速度 (INT8)

128 TOPS(Dense)

计算精度支持

支持 INT16, INT8, INT4, FP32, FP16

视频解码

支持

内存容量

16GB

内存位宽

256-bit

内存带宽

102.4 GB/s

系统接口

PCI Express 3.0 x16  支持lane reversal

PCI标识符

PCIe Vendor ID    0xCABC

PCIe Device ID     0x0270

PCIe Sub-Vendor ID    0xCABC

PCIe Sub-System ID    0x0012

外形

68.9mm*167.5mm, 单槽位

TDP功耗

70W

ECC保护

散热方案

被动

 

2.2. 软件规格

表 2 详细描述了 MLU270-S4 智能处理卡的软件规格:

表格 2 PCIE加速卡软件规格表

PCIe Base address

PF (1个,64bit):

BAR0: 256MB prefetchable

BAR2: 64 MB prefetchable

BAR4: 64 MB prefetchable

VF(4个,64bit):

BAR0: 256MB prefetchable

BAR2: 64 MB prefetchable

BAR4: 64 MB prefetchable

SMBus(8bit 地址)

0x8E(Write) 0x8F(Read)

 

SMBUS 寄存器位宽为 32 位,表 3 描述了寄存器基本读取流程(S:Slave,M:Master):

表格 3 SMBUS 寄存器读取流程

Direction

Bits

Content

M à S

1

START

M à S

8

SLAVE ADDRESS(Write)

S à M

1

ACK

M à S

8

REGISTER ADDRESS

S à M

1

ACK

M à S

1

RE START

M à S

8

SLAVE ADDRESS(Read)

S à M

1

ACK

S à M

8

DATA[7:0]

M à S

1

ACK

S à M

8

DATA[15:8]

M à S

1

ACK

S à M

8

DATA[23:16]

M à S

1

ACK

S à M

8

DATA[31:24]

M à S

1

NACK

M à S

1

STOP

 

下表详细描述了SMBUS寄存器的定义、地址及描述:

表格 4 SMBUS 寄存器描述

寄存器定义

地址

ACCESS

Description

板卡功耗

0x01

RO

板卡功耗,数据类型float,单位W

板卡温度

0x02

RO

板卡温度,数据类型float,单位℃

芯片温度

0x03

RO

芯片温度,数据类型float,单位℃

power brake

0x05

WO

写入0x04 主频降至当前的25%;写入0x01 恢复至降频前水平

PCIE Vendor ID and Device ID

0xA0

RO

[15:0] Vendor ID :0xCABC

[31:16] Device ID:0x0270

PCIE Sub-Vendor ID and Sub-System ID

0xA1

RO

[15:0] Sub-Vendor ID:0xCABC

[31:16] Sub-System ID : 0x0012 

PCIE_negotiated_speed

0xA2

RO

[7:0] 显示PCIE协商速率,例如0x03表示gen3  8GT/s; 0x02 表示 gen2  5GT/s;0x01 表示 gen1  2.5GT/s

PCIE_negotiated_link_width

0xA3

RO

[7:0]显示PCIE协商宽度,例如0x16表示 X16;0x08 表示 X8; 0x04 表示 X4; 0x02 表示 X2; 0x01 表示 X1

板卡类型

0xF0

RO

[7:0]显示板卡类型,例如0X12表示S4型号

设备厂商

0xF1

RO

[3:0]显示设备厂商编号

硬件版本号

0xF2

RO

[7:0]显示硬件版本编号,例如0x11表示硬件版本V1.1

固件版本号

0xF3

RO

[11:0]显示固件版本号,例如0x113 表示主版本号为1,子版本号为1,patch号为3

制造时间

0xF4

RO

[15:0]显示制造时间年月,例如0x1811表示18年11月生产

流水号

0xF5

RO

[19:0]显示设备的流水号,例如0x20023表示序列号流水号为20023

 

SN信息获取方式

SN号

[47:40]

[39:24]

[23:20]

[19:0]

0x121811120023

板卡类型

如 0x12

制造时间

如 0x1811

设备厂商

如 0x1

流水号

如 0x20023

2.3. 使用环境规格

表 5 详细描述了 MLU270-S4 智能处理卡的使用环境规格:

表格 5 MLU270-S4 智能处理卡使用环境规格表

工作温度

0℃~50°C

存储温度

-40℃~75℃

工作湿度

5%—95% 相对湿度

存储湿度

5%—95% 相对湿度

 

2.4. 结构尺寸规格

MLU270-S4 智能处理卡的外形结构尺寸如下图所示:

图 2 MLU270-S4 智能处理卡尺寸图(高挡片)

 

图 3 MLU270-S4 智能处理卡尺寸图(低挡片)

 

2.5. 包装尺寸和重量

MLU270-S4智能处理卡包装尺寸和重量信息如下表:

 

表格 6 MLU270-S4包装尺寸和重量

类型

重量

尺寸

备注

单卡

310g

NA

NA

工业包装

7.7kg

600mm*400mm*253mm

每个箱子16张卡

备注:重量为实测值,公差+-10%

 

2.6. 散热规格

2.6.1 MLU270-S4 板卡功耗和温度定义

表格 7 MLU270-S4 热设计功耗温度表

项目

参数

整板热设计功耗(TDP)

70W

MLU 建议工作结温 Tj

0-85℃

MLU 降频结温 Tj

87℃

MLU 降频幅度

50%

MLU 断电结温 Tj

95℃

 

2.6.2 MLU270-S4 散热器阻抗曲线

MLU270-S4 散热器实测得到的风阻曲线如下图:

图 4 MLU270-S4  散热器阻抗曲线

 

表格 8 MLU270-S4 板卡散热器风量-压降表

风量(CFM)

风压(mmAq)

3

5.1

3.5

7.0

4.3

10.5

5.4

16.6

6.7

25.6

8

36.5

 

2.6.3 MLU270-S4 支持插卡方向

MLU270-S4 支持插卡在机箱的前端及尾端,下图示两个方向都可以作为板卡的进风方向:

图5 板卡支持的进风风道方向图

 

2.6.4 MLU270-S4 支持工作的环境温度及各温度下散热器最低风量需求

MLU270-S4 支持 0-50℃ 环境温度(板卡散热器进风温度)下的使用需求( TDP 模式),各主要温度条件下的最低风量需求详见下表:

 

表格 9 MLU270-S4 散热器最低风量需求 vs 环境温度表

进风口温度(℃)

散热器最低风量需求(CFM)

30

3

35

3.5

40

4.3

45

5.4

50

6.7

55(不推荐)

8

                                                                       

2.6.5 MLU270-S4 入风口处的平均温度和通过散热器的最小有效风量的曲线关系

图6 环境温度与通过散热器的最小有效风量关系图

 

2.7. 电源与电气规格

电源接口的输入电压与电流规范见表格10与表格11.

表格 10电源接口的输入电压规范

电源接口

最小电压

正常电压

最大电压

PCIe 金手指(12V)

11.04V

12V

12.96V

PCIe 金手指(3V3)

3.0V

3.3V

3.63V

 

表格 11电流规范

电源接口

峰值电流

Moving Average

PCIe 金手指(12V)

20A

200us

17A

1ms

13A

5ms

 

Power Capping规范见表格12

表 12 Power Capping

Power Capping Threshold

70W

Power Capping Response time (typical)

50ms

Power Capping Response time (max)

100ms

 

Power Brake规范见表格13

表 13 Power Brake

PB# PCIe pin assignment

B30

Power Brake response time(typical)

150us

PB# input insertion low time (min)

250ms

Power brake hardware slowdown factor

4x

 

3. Cambricon NeuWare 开发环境

NeuWare全面支持各类主流编程框架(如TensorFlow、Caffe、PyTorch和MXNet等)。用户可面向上述编程框架,便捷地在寒武纪MLU270-S4上开发和部署深度学习应用。

同时,NeuWare提供了完整的运行时系统和驱动软件,方便系统快速集成。

NeuWare还提供了包括应用开发、功能调试、性能调优等在内的一系列工具。其中应用开发工具包括机器学习库、运行时库、编译器、模型重训练工具和特定领域(如视频分析领域)SDK等;功能调试工具可以满足编程框架、函数库等不同层次的调试需求;性能调优工具包括性能剖析工具和系统监控工具等。

 

图 7 Cambricon NeuWare

 

MLU220产品简介

1. 前言

免责声明

中科寒武纪科技股份有限公司(下称“寒武纪”)不代表、担保(明示、暗示或法定的)或保证本文件所含信息,并明示放弃对可销售性、所有权、不侵犯知识产权或特定目的适用性做出任何和所有暗示担保,且寒武纪不承担因应用或使用任何产品或服务而产生的任何责任。寒武纪不应对因下列原因产生的任何违约、损害赔偿、成本或问题承担任何责任:(1)使用寒武纪产品的任何方式违背本指南;或(2)客户产品设计。

责任限制

在任何情况下,寒武纪都不对因使用或无法使用本指南而导致的任何损害(包括但不限于利润损失、业务中断和信息损失等损害)承担责任,即便寒武纪已被告知可能遭受该等损害。尽管客户可能因任何理由遭受任何损害,根据寒武纪的产品销售条款与条件,寒武纪为本指南所述产品对客户承担的总共和累计责任应受到限制。   

信息准确性

本文件提供的信息属于寒武纪所有,且寒武纪保留不经通知随时对本文件信息或对任何产品和服务做出任何更改的权利。本指南所含信息和本指南所引用寒武纪文档的所有其他信息均“按原样”提供。寒武纪不担保信息、文本、图案、链接或本指南内所含其他项目的准确性或完整性。寒武纪可不经通知随时对本指南或本指南所述产品做出更改,但不承诺更新本指南。

本指南列出的性能测试和等级要使用特定芯片或计算机系统或组件来测量。经该等测试,本指南所示结果反映了寒武纪产品的大概性能。系统硬件或软件设计或配置的任何不同会影响实际性能。如上所述,寒武纪不代表、担保或保证本指南所述产品将适用于任何特定用途。寒武纪不代表或担保测试每种产品的所有参数。客户全权承担确保产品适合并适用于客户计划的应用以及对应用程序进行必要测试的责任,以期避免应用程序或产品的默认情况。

客户产品设计的脆弱性会影响寒武纪产品的质量和可靠性并导致超出本指南范围的额外或不同的情况和/或要求。

知识产权通知

寒武纪和寒武纪的标志是中科寒武纪科技股份有限公司在美国和其他国家的商标和/或注册商标。其他公司和产品名称应为与其关联的各自公司的商标。

本指南为版权所有并受全世界版权法律和条约条款的保护。未经寒武纪的事先书面许可,不可以任何方式复制、重制、修改、出版、上传、发布、传输或分发本指南。除了客户使用本指南信息和产品的权利,根据本指南,寒武纪不授予其他任何明示或暗示的权利或许可。未免疑义,寒武纪不根据任何专利、版权、商标、商业秘密或任何其他寒武纪的知识产权或所有权对客户授予任何(明示或暗示的)权利或许可。

版权声明

© 中科寒武纪科技股份有限公司保留一切权利。

版权声明

1.1.    版权声明

免责声明

中科寒武纪科技股份有限公司(下称“寒武纪”)不代表、担保(明示、暗示或法定的)或保证本文件所含信息,并明示放弃对可销售性、所有权、不侵犯知识产权或特定目的适用性做出任何和所有暗示担保,且寒武纪不承担因应用或使用任何产品或服务而产生的任何责任。寒武纪不应对因下列原因产生的任何违约、损害赔偿、成本或问题承担任何责任:(1)使用寒武纪产品的任何方式违背本指南;或(2)客户产品设计。

责任限制

在任何情况下,寒武纪都不对因使用或无法使用本指南而导致的任何损害(包括但不限于利润损失、业务中断和信息损失等损害)承担责任,即便寒武纪已被告知可能遭受该等损害。尽管客户可能因任何理由遭受任何损害,根据寒武纪的产品销售条款与条件,寒武纪为本指南所述产品对客户承担的总共和累计责任应受到限制。   

信息准确性

本文件提供的信息属于寒武纪所有,且寒武纪保留不经通知随时对本文件信息或对任何产品和服务做出任何更改的权利。本指南所含信息和本指南所引用寒武纪文档的所有其他信息均“按原样”提供。寒武纪不担保信息、文本、图案、链接或本指南内所含其他项目的准确性或完整性。寒武纪可不经通知随时对本指南或本指南所述产品做出更改,但不承诺更新本指南。

本指南列出的性能测试和等级要使用特定芯片或计算机系统或组件来测量。经该等测试,本指南所示结果反映了寒武纪产品的大概性能。系统硬件或软件设计或配置的任何不同会影响实际性能。如上所述,寒武纪不代表、担保或保证本指南所述产品将适用于任何特定用途。寒武纪不代表或担保测试每种产品的所有参数。客户全权承担确保产品适合并适用于客户计划的应用以及对应用程序进行必要测试的责任,以期避免应用程序或产品的默认情况。

客户产品设计的脆弱性会影响寒武纪产品的质量和可靠性并导致超出本指南范围的额外或不同的情况和/或要求。

知识产权通知

寒武纪和寒武纪的标志是中科寒武纪科技股份有限公司在美国和其他国家的商标和/或注册商标。其他公司和产品名称应为与其关联的各自公司的商标。

本指南为版权所有并受全世界版权法律和条约条款的保护。未经寒武纪的事先书面许可,不可以任何方式复制、重制、修改、出版、上传、发布、传输或分发本指南。除了客户使用本指南信息和产品的权利,根据本指南,寒武纪不授予其他任何明示或暗示的权利或许可。未免疑义,寒武纪不根据任何专利、版权、商标、商业秘密或任何其他寒武纪的知识产权或所有权对客户授予任何(明示或暗示的)权利或许可。

版本记录

1.1.    版本记录

表 1.1 版本记录

文档名称

MLU220产品简介

版本号

V1.0.4

作者

Cambricon

创建日期

2020/08/18

 

更新历史

1.2.    更新历史

V0.1

更新时间:2019/07/12

更新内容:

  • 初始版本

 

V0.9

更新时间:2019/09/19

更新内容:

  • 调整文档格式
  • 修改图4中的图示问题
  • 修改章节3.2.3中关于视频编解码子系统的错误描述
  • 增加章节3.2.8中关于MCU子系统的描述
  • 增补章节3.2.9的部分关于SDIO的描述内容
  • 增加章节4.1关于LPDDR4X接口时序

 

V0.91

更新时间:2019/10/16

更新内容:

  • 修改图4中的图示问题
  • 修改章节3.2.6中关于PCIe的描述
  • 修改章节5中关于DDR address mapping的描述

 

V0.95

更新时间:2020/1/9

更新内容:

  • 修改章节3.1 功耗参数
  • 修改章节3.5 SDIO电气参数
  •  

V0.96

更新时间:2020/3/11

更新内容:

  • 修改章节4 启动和升级模式
  • 修改章节3.4 GPIO电气参数

 

V1.0.0

更新时间:2020/6/1

更新内容:

  • 版本更新

 

V1.0.1

更新时间:2020/6/16

更新内容:

  • 修改表3中写法的描述,更新其中功耗测试的数据
  • 修改PCIe电气参数为要符合1
  • 修改章节3.2.4中部分描述
  • 格式刷新

 

V1.0.2

更新时间:2020/7/9

更新内容:

  • 补充第4章来料包装信息

 

V1.0.3

更新时间:2020/7/13

更新内容:

  • 更新章节3.2.3中的部分描述

 

V1.0.4

更新时间:2020/8/28

更新内容:

  • 更新章节3.1.1中的热设计功耗规格的部分内容

 

2. 产品概述

2.1 概述

MLU220芯片是一款专门用于深度学习的SOC芯片,它具有高算力,低功耗和丰富的I/O接口。MLU220集成了寒武纪1M架构AI处理器核心,芯片内置4核ARM CortexA55,64位宽LPDDR4X,内置硬件视频编解码单元,PCIe Gen3.0,SDIO,EMMC,GMAC等高速接口,可实现最大16TOPS(INT8)算力。

MLU220适用于数据边缘节点的数据分析和推理应用。其适用领域包括(但不仅限于):智能视频分析,智慧家居,智慧交通,智慧农业,智慧制造等领域。可广泛用于机器人,无人机等移动边缘计算应用。

由于采用先进的 16nm 低功耗工艺和小型化封装,同时支持LPDDR4X,使得MLU220可支撑产品小型化设计。

MLU220配套寒武纪提供的稳定、易用推理应用SDK设计,能够支撑客户快速产品量产。

2.2. 应用场景

智能NVR

图 2.1 NVR应用场景图示

 

智慧盒子

图 2.2智能盒子应用场景图示

 

智能加速协处理器

图 2.3智能加速协处理器应用场景图示

2.3. 架构

2.3.1 系统架构

MLU220的逻辑框图如下图所示。

图 2.4 MLU220逻辑框图

 

2.3.2 子系统架构

2.3.2.1 IPU Cluster

MLU220 IPU是针对边缘端inference需求而设计的高性能、低功耗的深度学习处理器。相关特性如下:

  • 支持Convolution [注1]
  • 支持Max/Min/Average-pooling[注2]
  • 支持Up-sample
  • 支持Padding
  • 支持激活函数(Relu、Sigmoid、TanH等)
  • 支持直方图操作
  • 支持查找表操作
  • 支持向量与矩阵的内积运算
  • 支持Element-wise运算
  • 支持Concat
  • 支持矩阵操作(转置、旋转、镜像等)
  • 支持高维[注3]数据Reshape
  • 支持压缩、解压
  • 支持元素操作(求向量内最大/小值及位置、求向量累加和、计数等)
  • 支持LRN、Batch-normalization、Scale
  • 支持数据类型可配置
  • 支持算法参数规模可配置

 

[注1]:支持任意kernel大小、stride大小、feature-map ratio、feature-map channel数、dilation大小

[注2]:支持任意kernel大小、stride大小、feature-map ratio、feature-map channel数、dilation大小

[注3]:不超过6维

 

MLU220 IPU支持卷积算力如下:

表 2.1 卷积算力列表

神经元

权值

算力

INT4

INT4

32TOPs

INT4

INT8

16TOPs

INT4

INT16

8TOPs

INT8

INT4

32TOPs

INT8

INT8

16TOPs

INT8

INT16

8TOPs

INT16

INT4

8TOPs

INT16

INT8

8TOPs

INT16

INT16

8TOPS

 

2.3.2.2 处理器子系统

  • 四核ARM Cortex A55@1.5GHz, 32KB I-Cache, 32KB D-Cache/128KB L2 cache/1MB L3 cache
  • 集成FPU单元,支持Neon加速特性
  • 集成Coresight,支持Debug&Trace
  • 集成GIC,支持最多480 SPI和16PPI的中断管理

 

2.3.2.3 视频编解码子系统

  • 支持264 Baseline Profile(BP), H.264 Main Profile(MP),H.264 High Profile(HP),H.264 High 10 Profile格式编解码
  • 支持HEVC (H.265) Main/Main 10 Profile格式编解码
  • 支持VP8/VP9 Profile 0解码
  • 编码性能:可以支持8X 1080P @30fps
  • 解码性能:可以支持16X 1080P@30fps

 

2.3.2.4 图片编解码子系统

  • 支持符合Baseline ISO/IEC 10918-1 JPEG标准的JPEG编解码
  • 最大支持32768x32768的图片尺寸
  • 解码输入支持4:0:0, 4:2:0, 4:2:2, 4:4:0和4:4:4的格式
  • 解码性能:820 fps@FHD
  • 编码性能:800 fps@FHD

 

2.3.2.5 图片处理子系统

  • 支持ARGB8888、RGB565、YUV422(YUYV/YVYU/UYVY/VYUY)、YUV420SP(NV12/NV21)、YUV420P输入格式
  • 支持ARGB8888、RGB565、YUV422(YUYV/YVYU/UYVY/VYUY)、YUV420SP(NV12/NV21)输出格式
  • 支持最大图像分辨率16384x16384
  • 支持最小图像分辨率2x2
  • 水平、垂直最大缩放倍数各支持:缩小64倍,放大64倍

 

2.3.2.6 PCIe子系统

  • 最大支持Gen3速率,单lane的线速率为8Gb/s
  • 支持2种lane size模式,分别为X2和X1模式
  • 集成两个PCIe控制器,可以支持下面的EP/RC工作模式组合
    • 1个EP模式(X2)和1个RC模式(X2)
    • 2个RC模式(X2)
    • 不支持2个EP模式
  • 最大带宽为2GB/s

 

2.3.2.7 存储器子系统

  • LPDDR4X接口
  • 64bit 数据宽度
  • 速率最高支持到3733Mb/s
  • 支持外接2个x32 DRAM颗粒
  • 支持外接1个x32 DRAM颗粒
  • SPI NAND/NOR Flash接口
    • 支持SPI STAND模式,SPI DUAL模式,SPI QUAD模式
    • 支持SPI 四种极性
    • 支持SPI SCLK由工作时钟进行分频产生,分频倍数可配
    • 支持SPI WP(write protect)和HOLD端口信号可配
    • 访问Nand Flash时,反馈ECC校验错误
    • 支持SPI Read Latency
  • eMMC接口
  • 支持1协议
  • 支持1线/4线/8线传输
  • 支持HS400/HS200/HS DDR/HS SDR/
  • 最大支持2TB的容量
  • 支持8V设备

 

2.3.2.8 MCU子系统

  • 集成ARM Cortex M0@250MHz
  • 与外部AP系统解耦合
  • 支持专用UART调试
  • 支持对系统中通用外设进行控制(I2C/TACH)
  • 支持对片内PVT sensor进行控制
  • 支持对芯片进行低功耗管理

 

2.3.2.9外设接口

  • SDIO接口
  • 全芯片支持2组SDIO接口
  • 支持0协议
  • 支持1线/4线传输
  • 支持UHS-I传输模式
  • 支持SDR104/DDR50/SDR50/SDR25/SDR12
  • 支持8V/3.3V设备
  • GMAC接口
  • 全芯片支持2组GMAC接口
  • 支持10/100/1000Mbps的工作模式
  • 支持全双工或半双工工作模式
  • 支持RMII/RGMII接口
  • TACH接口
  • 支持1路PWM输出
  • 支持1路TACH信号检测
  • 支持两种工作模式:PWM和RPM(Revolutions Per Minute)
  • I2C接口
  • 全芯片支持7个I2C接口
  • SPI接口
  • 全芯片支持2个SPI 接口
  • UART接口
  • 全芯片支持5个UART接口(其中3个用于debug打印)
  • GPIO接口
  • 全芯片支持90个可编程管脚

 

2.3.2.10 SDK

芯片的配套软件还提供以下软件SDK

  • 用于边缘计算的专用SDK
  • 用于神经网络的多种算子库
  • 高性能视频解码库
  • 高性能图片解码库

2.4. 启动和升级模式

MLU220使用硬线管脚PAD_BOOT_MODE[1:0]控制芯片的启动方式,

表 2.2 芯片启动方式

PAD_BOOT_MODE[1:0]

启动方式

2’b00

Reserved

2’b01

UART加载

2’b10

SPI启动

2’b11

SPI自举启动

 

PAD_BOOT_MODE[2:0]在芯片上电后,内部逻辑会对该值Latch,使解复位后,该管脚值的改变不会影响到芯片内部逻辑;芯片只有下电再次上电后,内部逻辑才会对外部管脚值重新进行Latch。

 

  • SPI启动

SPI启动是MLU220中的次要启动方式。启动过程为:通过BootROM引导CPU完成对SPI Flash控制器的初始化,并通过SPIFlash控制器将镜像搬运至片上RAM。

 

  • SPI自举启动

SPI自举是MLU220中的备份启动方式。启动过程为:通过BootCtrl完成对SFC初始化,并使能SFC的自举功能,将镜像搬运至片上RAM。

 

  • UART加载

UART加载,Bootrom引导CPU初始化UART,然后通过UART将PC中的镜像烧录到指定存储介质中的镜像。

2.5. 地址空间映射

MLU220内部有两套地址映射空间

  • SOC内部A55,PCIe(做EP时)使用一套地址空间:SOC地址空间
  • SOC内部的MCU子系统使用另外一套地址空间:MCU地址空间

具体SOC地址空间映射表,如下:

表 2.3 SOC地址空间映射

起始地址

结束地址

大小

功能

0x00_0000_0000

0x1F_FFFF_FFFF

128GB

DDR Memory空间

0x20_0000_0000

0x20_0000_7FFF

32KB

Bootrom空间

0x20_0000_8000

0x20_0FFF_FFFF

-

保留

0x20_1000_0000

0x20_1001_FFFF

128KB

片上SRAM空间

0x20_1002_0000

0x20_3FFF_FFFF

-

保留

0x20_4000_0000

0x20_4000_0FFF

4KB

DET空间

0x20_4000_1000

0x23_FFFF_FFFF

-

保留

0x24_0000_0000

0x25_FFFF_FFFF

8GB

PCIE_LINK0 RC映射空间

0x26_0000_0000

0x27_FFFF_FFFF

8GB

PCIE_LINK1 RC映射空间

0x28_0000_0000

0x7F_FFFF_FFFF

-

保留

0x80_0000_0000

0x80_0000_0FFF

4KB

SYSCTRL寄存器

0x80_0000_1000

0x80_0000_1FFF

4KB

Peri WDG寄存器

0x80_0000_2000

0x80_0000_2FFF

4KB

ATOMIC寄存器

0x80_0000_3000

0x80_0000_3FFF

4KB

Peri MBX0寄存器

0x80_0000_4000

0x80_0000_4FFF

4KB

Peri MBX1寄存器

0x80_0000_5000

0x80_0000_FFFF

44KB

Peri TIMER寄存器

0x80_0001_0000

0x80_0001_0FFF

4KB

Peri UART0寄存器

0x80_0001_1000

0x80_0001_1FFF

4KB

Peri UART1寄存器

0x80_0001_2000

0x80_0001_2FFF

4KB

Peri GPIO寄存器

0x80_0001_3000

0x80_0001_3FFF

4KB

Peri PWM寄存器

0x80_0001_4000

0x80_0001_4FFF

4KB

Peri SPI0寄存器

0x80_0001_5000

0x80_0001_5FFF

4KB

Peri SPI1寄存器

0x80_0001_6000

0x80_0001_6FFF

4KB

Peri I2C0寄存器

0x80_0001_7000

0x80_0001_7FFF

4KB

Peri I2C1寄存器

0x80_0001_8000

0x80_0001_8FFF

4KB

Peri I2C2寄存器

0x80_0001_9000

0x80_0001_9FFF

4KB

Peri I2C3寄存器

0x80_0001_A000

0x80_0001_AFFF

4KB

Peri I2C4寄存器

0x80_0001_B000

0x80_0001_BFFF

4KB

APB2JTAG寄存器

0x80_0001_C000

0x80_0001_FFFF

-

保留

0x80_0002_0000

0x80_0002_0FFF

4KB

PMU寄存器

0x80_0002_1000

0x80_0002_1FFF

4KB

CRG寄存器

0x80_0002_2000

0x80_0002_2FFF

4KB

BOOTCTRL寄存器

0x80_0002_3000

0x80_0002_3FFF

4KB

SFC寄存器

0x80_0002_4000

0x80_0002_4FFF

4KB

AXIMON_HUB寄存器

0x80_0002_8000

0x80_0002_8FFF

4KB

SCALER0寄存器

0x80_0002_9000

0x80_0002_9FFF

4KB

SCA0 CQH寄存器

0x80_0002_A000

0x80_0002_AFFF

4KB

SCA0 SMMU寄存器

0x80_0002_C000

0x80_0002_CFFF

4KB

EFUSEC寄存器

0x80_0002_D000

0x80_0002_DFFF

4KB

PINMUX寄存器

0x80_0002_E000

0x80_0002_EFFF

4KB

PAD寄存器

0x80_0002_F000

0x80_0002_FFFF

-

保留

0x80_0003_0000

0x80_0003_FFFF

64KB

GBC寄存器

0x80_0004_0000

0x80_0004_1FFF

8KB

EMMC寄存器

0x80_0004_2000

0x80_0004_2FFF

4KB

EMMC SMMU寄存器

0x80_0004_3000

0x80_0004_3FFF

-

保留

0x80_0004_4000

0x80_0004_5FFF

8KB

SDIO0寄存器

0x80_0004_6000

0x80_0004_6FFF

4KB

SDIO0 SMMU寄存器

0x80_0004_7000

0x80_0004_7FFF

-

保留

0x80_0004_8000

0x80_0004_9FFF

8KB

SDIO1寄存器

0x80_0004_A000

0x80_0004_AFFF

4KB

SDIO1 SMMU寄存器

0x80_0005_0000

0x80_0005_1FFF

8KB

GMAC0寄存器

0x80_0005_2000

0x80_0005_2FFF

4KB

GMAC0 SMMU寄存器

0x80_0005_3000

0x80_0005_3FFF

-

保留

0x80_0005_4000

0x80_0005_5FFF

8KB

GMAC1寄存器

0x80_0005_6000

0x80_0005_6FFF

4KB

GMAC1 SMMU寄存器

0x80_0005_7000

0x80_0005_7FFF

-

保留

0x80_0007_8000

0x80_0007_8FFF

4KB

SCALER1寄存器

0x80_0007_9000

0x80_0007_9FFF

4KB

SCA1 CQH寄存器

0x80_0007_A000

0x80_0007_AFFF

4KB

SCA1 SMMU寄存器

0x80_0007_B000

0x80_0007_FFFF

-

保留

0x80_0008_0000

0x80_0008_FFFF

64KB

MS RAM空间

0x80_0009_0000

0x80_0009_0FFF

4KB

MS_CRG寄存器

0x80_0009_1000

0x80_0009_1FFF

4KB

MS_UART寄存器

0x80_0009_2000

0x80_0009_2FFF

4KB

MS_WDG寄存器

0x80_0009_3000

0x80_0009_3FFF

4KB

MS_MBX寄存器

0x80_0009_4000

0x80_0009_4FFF

4KB

MS_I2C寄存器

0x80_0009_5000

0x80_0009_5FFF

4KB

MS_TACH寄存器

0x80_0009_6000

0x80_0009_6FFF

4KB

PVT寄存器

0x80_0009_7000

0x80_0009_7FFF

-

保留

0x80_0009_8000

0x80_0009_EFFF

28KB

MS_TIMER寄存器

0x80_0009_F000

0x80_0009_FFFF

-

保留

0x80_0010_0000

0x80_0010_1FFF

8KB

Memsys DDR寄存器

0x80_0010_2000

0x80_0010_2FFF

4KB

Memsys LLC寄存器

0x80_0010_3000

0x80_0010_3FFF

4KB

Memsys DTE0寄存器

0x80_0010_4000

0x80_0010_4FFF

4KB

Memsys DTE1寄存器

0x80_0010_5000

0x80_0010_5FFF

4KB

Memsys DTE2寄存器

0x80_0010_6000

0x80_0010_6FFF

4KB

Memsys DTE3寄存器

0x80_0010_7000

0x80_0010_FFFF

-

保留

0x80_0011_0000

0x80_0011_3FFF

16KB

Memsys DDRC0寄存器

0x80_0011_4000

0x80_0010_7FFF

16KB

Memsys DDRC1寄存器

0x80_0011_8000

0x80_0011_BFFF

16KB

Memsys DDRC2寄存器

0x80_0011_C000

0x80_0011_FFFF

16KB

Memsys DDRC3寄存器

0x80_0012_0000

0x80_001F_FFFF

-

保留

0x80_0020_0000

0x80_003F_FFFF

2MB

Memsys PHY0寄存器

0x80_0040_0000

0x80_005F_FFFF

2MB

Memsys PHY1寄存器

0x80_0060_0000

0x80_0060_0FFF

4KB

Cpusys SYSCTRL寄存器

0x80_0060_1000

0x80_0060_2FFF

8KB

Cpusys GENTIMER寄存器

0x80_0060_3000

0x80_0060_3FFF

4KB

Cpusys UART0寄存器

0x80_0060_4000

0x80_0060_4FFF

4KB

Cpusys UART1寄存器

0x80_0060_5000

0x80_0060_5FFF

-

保留

0x80_0060_6000

0x80_0060_FFFF

44KB

Cpusys TIMER寄存器

0x80_0061_0000

0x80_0061_FFFF

64KB

Cpusys JOBSCH寄存器

0x80_0062_0000

0x80_007F_FFFF

-

保留

0x80_0080_0000

0x80_009F_FFFF

2MB

Cpusys GIC寄存器

0x80_00A0_0000

0x80_00A0_1FFF

8KB

Ipu_sys0 SYSCTRL寄存器

0x80_00A0_2000

0x80_00A0_3FFF

8KB

Ipu_sys0 SMMU寄存器

0x80_00A0_4000

0x80_00A0_5FFF

8KB

Ipu_sys1 SYSCTRL寄存器

0x80_00A0_6000

0x80_00A0_7FFF

8KB

Ipu_sys1 SMMU寄存器

0x80_00A0_8000

0x80_00A0_9FFF

8KB

Ipu_sys2 SYSCTRL寄存器

0x80_00A0_A000

0x80_00A0_BFFF

8KB

Ipu_sys2 SMMU寄存器

0x80_00A0_C000

0x80_00A0_DFFF

8KB

Ipu_sys3 SYSCTRL寄存器

0x80_00A0_E000

0x80_00A0_FFFF

8KB

Ipu_sys3 SMMU寄存器

0x80_00A1_0000

0x80_00A1_1FFF

8KB

Ipu_mem寄存器

0x80_00A1_2000

0x80_00A1_3FFF

8KB

Ipu_mem SMMU寄存器

0x80_00A1_4000

0x80_00A1_7FFF

-

保留

0x80_00A1_8000

0x80_00A1_9FFF

8KB

Ipu寄存器

0x80_00A1_A000

0x80_00AF_FFFF

-

保留

0x80_00B0_0000

0x80_00B0_FFFF

64KB

PCIE_LINK0 SYSCTRL寄存器

0x80_00B1_0000

0x80_00B1_FFFF

64KB

PCIE_LINK0 GICEP寄存器

0x80_00B2_0000

0x80_00B2_FFFF

64KB

PCIE_LINK0 GICRC寄存器

0x80_00B3_0000

0x80_00B3_0FFF

4KB

PCIE_LINK0 SMMU寄存器

0x80_00B3_1000

0x80_00B3_FFFF

-

保留

0x80_00B4_0000

0x80_00B4_FFFF

64KB

PCIE_LINK1 SYSCTRL寄存器

0x80_00B5_0000

0x80_00B5_FFFF

64KB

PCIE_LINK1 GICEP寄存器

0x80_00B6_0000

0x80_00B6_FFFF

64KB

PCIE_LINK1 GICRC寄存器

0x80_00B7_0000

0x80_00B7_0FFF

4KB

PCIE_LINK1 SMMU寄存器

0x80_00B7_1000

0x80_00B7_7FFF

-

保留

0x80_00B7_8000

0x80_00B7_8FFF

4KB

PCIE_LINK0 PHYCMN寄存器

0x80_00B7_9000

0x80_00B7_BFFF

-

保留

0x80_00B7_C000

0x80_00B7_CFFF

4KB

PCIE_LINK1 PHYCMN寄存器

0x80_00B7_D000

0x80_00B7_FFFF

-

保留

0x80_00B8_0000

0x80_00BB_FFFF

256KB

PCIE_LINK0 PHY寄存器

0x80_00BC_0000

0x80_00BF_FFFF

256KB

PCIE_LINK1 PHY寄存器

0x80_00C0_0000

0x80_00C0_0FFF

4KB

Vpusys0 SYSCTRL寄存器

0x80_00C0_1000

0x80_00C0_1FFF

4KB

Vpusys0 JPUDMA寄存器

0x80_00C0_2000

0x80_00C0_2FFF

4KB

Vpusys0 VPU寄存器

0x80_00C0_3000

0x80_00C0_3FFF

4KB

Vpusys0 JPUSMMU寄存器

0x80_00C0_4000

0x80_00C0_4FFF

4KB

Vpusys0 JPU寄存器

0x80_00C0_5000

0x80_00C1_FFFF

-

保留

0x80_00C2_0000

0x80_00C2_0FFF

4KB

Vpusys1 SYSCTRL寄存器

0x80_00C2_1000

0x80_00C2_1FFF

4KB

Vpusys1 JPUDMA寄存器

0x80_00C2_2000

0x80_00C2_2FFF

4KB

Vpusys1 VPU寄存器

0x80_00C2_3000

0x80_00C2_3FFF

4KB

Vpusys1 JPUSMMU寄存器

0x80_00C2_4000

0x80_00C2_4FFF

4KB

Vpusys1 JPU寄存器

 

具体MCU地址空间映射表,如下:

表 2.4 MCU地址空间映射

起始地址

结束地址

大小

功能

0x0000_0000

0x0000_7FFF

32KB

MS Memory空间

0x4000_0000

0x4000_0FFF

4KB

MS SCCRG寄存器

0x4000_1000

0x4000_1FFF

4KB

MS UART寄存器

0x4000_2000

0x4000_2FFF

4KB

MS Watchdog寄存器

0x4000_3000

0x4000_3FFF

4KB

MS Mailbox寄存器

0x4000_4000

0x4000_4FFF

4KB

MS I2C寄存器

0x4000_5000

0x4000_5FFF

4KB

MS Tach寄存器

0x4000_6000

0x4000_6FFF

4KB

PVT Ctrl寄存器

0x4000_8000

0x4000_EFFF

28KB

MS Timer寄存器

0xA000_0000

0xA000_0FFF

4KB

SYSCTRL寄存器

0xA000_1000

0xA000_1FFF

4KB

Peri WDG寄存器

0xA000_2000

0xA000_2FFF

4KB

ATOMIC寄存器

0xA000_3000

0xA000_3FFF

4KB

Peri MBX0寄存器

0xA000_4000

0xA000_4FFF

4KB

Peri MBX1寄存器

0xA000_5000

0xA000_FFFF

44KB

Peri TIMER寄存器

0xA001_0000

0xA001_0FFF

4KB

Peri UART0寄存器

0xA001_1000

0xA001_1FFF

4KB

Peri UART1寄存器

0xA001_2000

0xA001_2FFF

4KB

Peri GPIO寄存器

0xA001_3000

0xA001_3FFF

4KB

Peri PWM寄存器

0xA001_4000

0xA001_4FFF

4KB

Peri SPI0寄存器

0xA001_5000

0xA001_5FFF

4KB

Peri SPI1寄存器

0xA001_6000

0xA001_6FFF

4KB

Peri I2C0寄存器

0xA001_7000

0xA001_7FFF

4KB

Peri I2C1寄存器

0xA001_8000

0xA001_8FFF

4KB

Peri I2C2寄存器

0xA001_9000

0xA001_9FFF

4KB

Peri I2C3寄存器

0xA001_A000

0xA001_AFFF

4KB

Peri I2C4寄存器

0xA001_B000

0xA001_BFFF

4KB

APB2JTAG寄存器

0xA001_C000

0xA001_FFFF

-

保留

0xA002_0000

0xA002_0FFF

4KB

PMU寄存器

0xA002_1000

0xA002_1FFF

4KB

CRG寄存器

0xA002_2000

0xA002_2FFF

4KB

BOOTCTRL寄存器

0xA002_3000

0xA002_3FFF

4KB

SFC寄存器

0xA002_4000

0xA002_4FFF

4KB

AXIMON_HUB寄存器

0xA002_8000

0xA002_8FFF

4KB

SCALER0寄存器

0xA002_9000

0xA002_9FFF

4KB

SCA0 CQH寄存器

0xA002_A000

0xA002_AFFF

4KB

SCA0 SMMU寄存器

0xA002_C000

0xA002_CFFF

4KB

EFUSEC寄存器

0xA002_D000

0xA002_DFFF

4KB

PINMUX寄存器

0xA002_E000

0xA002_EFFF

4KB

PAD寄存器

0xA002_F000

0xA002_FFFF

-

保留

0xA003_0000

0xA003_FFFF

64KB

GBC寄存器

0xA004_0000

0xA004_1FFF

8KB

EMMC寄存器

0xA004_2000

0xA004_2FFF

4KB

EMMC SMMU寄存器

0xA004_3000

0xA004_3FFF

-

保留

0xA004_4000

0xA004_5FFF

8KB

SDIO0寄存器

0xA004_6000

0xA004_6FFF

4KB

SDIO0 SMMU寄存器

0xA004_7000

0xA004_7FFF

-

保留

0xA004_8000

0xA004_9FFF

8KB

SDIO1寄存器

0xA004_A000

0xA004_AFFF

4KB

SDIO1 SMMU寄存器

0xA005_0000

0xA005_1FFF

8KB

GMAC0寄存器

0xA005_2000

0xA005_2FFF

4KB

GMAC0 SMMU寄存器

0xA005_3000

0xA005_3FFF

-

保留

0xA005_4000

0xA005_5FFF

8KB

GMAC1寄存器

0xA005_6000

0xA005_6FFF

4KB

GMAC1 SMMU寄存器

0xA005_7000

0xA005_7FFF

-

保留

0xA007_8000

0xA007_8FFF

4KB

SCALER1寄存器

0xA007_9000

0xA007_9FFF

4KB

SCA1 CQH寄存器

0xA007_A000

0xA007_AFFF

4KB

SCA1 SMMU寄存器

0xA007_B000

0xA007_FFFF

-

保留

0xA008_0000

0xA008_FFFF

64KB

MS RAM空间

0xA009_0000

0xA009_0FFF

4KB

MS_CRG寄存器

0xA009_1000

0xA009_1FFF

4KB

MS_UART寄存器

0xA009_2000

0xA009_2FFF

4KB

MS_WDG寄存器

0xA009_3000

0xA009_3FFF

4KB

MS_MBX寄存器

0xA009_4000

0xA009_4FFF

4KB

MS_I2C寄存器

0xA009_5000

0xA009_5FFF

4KB

MS_TACH寄存器

0xA009_6000

0xA009_6FFF

4KB

PVT寄存器

0xA009_7000

0xA009_7FFF

-

保留

0xA009_8000

0xA009_EFFF

28KB

MS_TIMER寄存器

0xA009_F000

0xA009_FFFF

-

保留

0xA010_0000

0xA010_1FFF

8KB

Memsys DDR寄存器

0xA010_2000

0xA010_2FFF

4KB

Memsys LLC寄存器

0xA010_3000

0xA010_3FFF

4KB

Memsys DTE0寄存器

0xA010_4000

0xA010_4FFF

4KB

Memsys DTE1寄存器

0xA010_5000

0xA010_5FFF

4KB

Memsys DTE2寄存器

0xA010_6000

0xA010_6FFF

4KB

Memsys DTE3寄存器

0xA010_7000

0xA010_FFFF

-

保留

0xA011_0000

0xA011_3FFF

16KB

Memsys DDRC0寄存器

0xA011_4000

0xA010_7FFF

16KB

Memsys DDRC1寄存器

0xA011_8000

0xA011_BFFF

16KB

Memsys DDRC2寄存器

0xA011_C000

0xA011_FFFF

16KB

Memsys DDRC3寄存器

0xA012_0000

0xA01F_FFFF

-

保留

0xA020_0000

0xA03F_FFFF

2MB

Memsys PHY0寄存器

0xA040_0000

0xA05F_FFFF

2MB

Memsys PHY1寄存器

0xA060_0000

0xA060_0FFF

4KB

Cpusys SYSCTRL寄存器

0xA060_1000

0xA060_2FFF

8KB

Cpusys GENTIMER寄存器

0xA060_3000

0xA060_3FFF

4KB

Cpusys UART0寄存器

0xA060_4000

0xA060_4FFF

4KB

Cpusys UART1寄存器

0xA060_5000

0xA060_5FFF

-

保留

0xA060_6000

0xA060_FFFF

44KB

Cpusys TIMER寄存器

0xA061_0000

0xA061_FFFF

64KB

Cpusys JOBSCH寄存器

0xA062_0000

0xA07F_FFFF

-

保留

0xA080_0000

0xA09F_FFFF

2MB

Cpusys GIC寄存器

0xA0A0_0000

0xA0A0_1FFF

8KB

Ipu_sys0 SYSCTRL寄存器

0xA0A0_2000

0xA0A0_3FFF

8KB

Ipu_sys0 SMMU寄存器

0xA0A0_4000

0xA0A0_5FFF

8KB

Ipu_sys1 SYSCTRL寄存器

0xA0A0_6000

0xA0A0_7FFF

8KB

Ipu_sys1 SMMU寄存器

0xA0A0_8000

0xA0A0_9FFF

8KB

Ipu_sys2 SYSCTRL寄存器

0xA0A0_A000

0xA0A0_BFFF

8KB

Ipu_sys2 SMMU寄存器

0xA0A0_C000

0xA0A0_DFFF

8KB

Ipu_sys3 SYSCTRL寄存器

0xA0A0_E000

0xA0A0_FFFF

8KB

Ipu_sys3 SMMU寄存器

0xA0A1_0000

0xA0A1_1FFF

8KB

Ipu_mem寄存器

0xA0A1_2000

0xA0A1_3FFF

8KB

Ipu_mem SMMU寄存器

0xA0A1_4000

0xA0A1_7FFF

-

保留

0xA0A1_8000

0xA0A1_9FFF

8KB

Ipu寄存器

0xA0A1_A000

0xA0AF_FFFF

-

保留

0xA0B0_0000

0xA0B0_FFFF

64KB

PCIE_LINK0 SYSCTRL寄存器

0xA0B1_0000

0xA0B1_FFFF

64KB

PCIE_LINK0 GICEP寄存器

0xA0B2_0000

0xA0B2_FFFF

64KB

PCIE_LINK0 GICRC寄存器

0xA0B3_0000

0xA0B3_0FFF

4KB

PCIE_LINK0 SMMU寄存器

0xA0B3_1000

0xA0B3_FFFF

-

保留

0xA0B4_0000

0xA0B4_FFFF

64KB

PCIE_LINK1 SYSCTRL寄存器

0xA0B5_0000

0xA0B5_FFFF

64KB

PCIE_LINK1 GICEP寄存器

0xA0B6_0000

0xA0B6_FFFF

64KB

PCIE_LINK1 GICRC寄存器

0xA0B7_0000

0xA0B7_0FFF

4KB

PCIE_LINK1 SMMU寄存器

0xA0B7_1000

0xA0B7_7FFF

-

保留

0xA0B7_8000

0xA0B7_8FFF

4KB

PCIE_LINK0 PHYCMN寄存器

0xA0B7_9000

0xA0B7_BFFF

-

保留

0xA0B7_C000

0xA0B7_CFFF

4KB

PCIE_LINK1 PHYCMN寄存器

0xA0B7_D000

0xA0B7_FFFF

-

保留

0xA0B8_0000

0xA0BB_FFFF

256KB

PCIE_LINK0 PHY寄存器

0xA0BC_0000

0xA0BF_FFFF

256KB

PCIE_LINK1 PHY寄存器

0xA0C0_0000

0xA0C0_0FFF

4KB

Vpusys0 SYSCTRL寄存器

0xA0C0_1000

0xA0C0_1FFF

4KB

Vpusys0 JPUDMA寄存器

0xA0C0_2000

0xA0C0_2FFF

4KB

Vpusys0 VPU寄存器

0xA0C0_3000

0xA0C0_3FFF

4KB

Vpusys0 JPUSMMU寄存器

0xA0C0_4000

0xA0C0_4FFF

4KB

Vpusys0 JPU寄存器

0xA0C0_5000

0xA0C1_FFFF

-

保留

0xA0C2_0000

0xA0C2_0FFF

4KB

Vpusys1 SYSCTRL寄存器

0xA0C2_1000

0xA0C2_1FFF

4KB

Vpusys1 JPUDMA寄存器

0xA0C2_2000

0xA0C2_2FFF

4KB

Vpusys1 VPU寄存器

0xA0C2_3000

0xA0C2_3FFF

4KB

Vpusys1 JPUSMMU寄存器

0xA0C2_4000

0xA0C2_4FFF

4KB

Vpusys1 JPU寄存器

0xA0C2_5000

0xA0DF_FFFF

-

保留

0xA0E0_0000

0xA0FF_FFFF

2MB

NOCBUS寄存器

0xA100_0000

0xA1FF_FFFF

-

保留

0xA200_0000

0xA2FF_FFFF

16MB

Cpusys STM空间

0xA300_0000

0xA3FF_FFFF

-

保留

0xA400_0000

0xA5FF_FFFF

32MB

Cpusys Coresight空间

 

2.6. EFUSE空间定义

MLU220提供接口,使得用户以Group为单位获取EFUSE中的信息,每个Group为32bit,用户无法烧写EFUSE,只能读取EFUSE信息,具体EFUSE信息如下分配。

表 2.5 EFUSE分配表

Group

All Bit

Descriptions

[1:0]

[63:0]

Chip ID information

[2]

[69:64]

Wafer No.

[71:69]

CP efuse flag

[87:72]

TS calibration information

[91:88]

Chip version

[95:92]

Reserved for user

3. 硬件特性

3.1. 封装与管脚分布

3.1.1封装

MLU220芯片采用FCCSP封装,封装尺寸15mm x 15mm,管脚间距为0.4mm,管脚总数为1042个。

详细封装请参见图 3.1~3.3,封装尺寸参数请参见表 3.1。

 

图 3.1封装顶视图

 

图 3.2 封装底视图

 

图 3.3 封装侧视图

 

表 3.1 封装参数说明

 

3.1.2 管脚分布

MLU220芯片共有1042个管脚,管脚数目统计表如下表

表 3.2管脚数目统计表

管脚类别

数量

I/O

302

数字电源

186

数字地

532

模拟电源及其他电源

17

模拟地及其他地

5

 

3.2. 管脚信息描述

芯片管脚信息、管脚电源域信息、数字管脚默认状态描述请参考文档:《MLU220_PINOUT.xlsx》

 

3.2.1 焊接工艺建议

焊接工艺:无铅回流焊

耐回流次数:≤3次

推荐回流曲线如下:

图 3.4回流曲线

 

3.2.2 潮敏参数

潮敏等级:MSL 3

3.3. 电性能参数

3.3.1 功耗参数

3.3.1.1 热设计功耗规格

表 3.3 MLU220功耗算力对应表

场景

功耗(W

算力@工况

持续时间

Min

Typ

Max

 

 

场景01

-

8

8.5

Resnet50 600fps,

结温50℃

稳态

场景02

-

10

11

Resnet50 600fps,

结温95℃

稳态

场景03

-

4

4.5

No AI Computation,

结温40℃

稳态

 

3.3.1.2 温度规格

表 3.4 MLU220温度规格表

项目

参数

MLU220最小工作温度Tj

-40℃

MLU220建议最大工作温度Tj

95℃

MLU220 破坏温度Tj

125℃

工作环境温度范围

-40 ~ 70℃

 

3.3.1.3 封装热阻

表 3.5 芯片热阻

项目

参数

Rjc

0.033℃/W

Rjb

5℃/W

Rja

TBD(以具体场景和散热类型定义)

 

3.3.2工作条件

MLU220芯片的工作条件如下表所示:

表 3.6 芯片工作电压

Power Domain

Ball Name

Voltage

Voltage Spec

Default

Notes

PCIE

AVDD_C

0.8V

0.76V~0.88V

On

Analog bias power. There are no power supply sequence requirements.

PCIE

AVDD_D

0.8V

0.76V~0.88V

On

Digital power. The same as above.

PCIE

AVVD_H

1.8V

1.42V~1.98V

On

IO level voltage power. The same as above.

DDR

VDD_DDR

0.8V

0.75V~0.88V

On

Digital power supply.

DDR

VDDQ

1.1V

1.06V~1.17V

On

IO power supply.

DDR

VDDQLP

0.6V

0.57V~0.63V

On

IO power supply for LP4X.

DDR

VAA

1.8V

1.62V~1.98V

On

PLL power supply.

SDMMC

VDDIO

1.8V

1.62V~1.98V

On

VDDIO33, VDDIO and VDD can be turned on in any order.

SDMMC

VDDIO33

3.3V

2.70V~3.63V

On

The same as above.

EFUSE

VQPS

1.8V

1.62V~1.98V

Off

Just for effuse program function.

CORE

VDD

0.8V

0.72V~0.98V

On

According to the from high to low rule, VDD power before the VDDL maybe preferred.

CORE

VDDL

0.75V

0.675V~0.825V

On

The same as above.

PLL(R)

VDDHV_R

1.8V

1.62V~1.98V

On

Power sequence is NOT important. Both supplies must be stable before enabling PLL.

PLL(R)

VDDREF_R

0.8V

0.72V~0.88V

On

The same as above.

PLL(L)

VDDHV_L

1.8V

1.62V~1.98V

On

The same as above.

PLL(L)

VDDREF_L

0.8V

0.72V~0.88V

On

The same as above.

PVT

VDDA

1.8V

1.62V~1.98V

On

No necessary order with VDD.

GPIO

VDDPST

1.8V

1.62V~1.98V

On

Prefered: Power-up VDDPST first and then the core power(VDD).

Not recommended: Power up the VDD first and then the I/O power(VDDST), it would lead to ~ua leakage.

The VDD/VDDPST power must be full on before the input signals of digital I/O cells toggle.

The reverse for power down.

POR

TACVDD

0.8V

0.72V~0.88V

On

VS_POR(VDD)should power on after NVDDL(TACVDD) or same as NVDDL.

No constrainst for power down.

 

3.3.3上下电顺序

对应表 3.6的工作电压的上电顺序如下图所示,

图 3.5 电源上电时序

电源下电时序为电源上电时序的反向。

 

3.3.4 GPIO 电气参数

表 3.7 GPIO电气参数

符号

参数

最小值

典型值

最大值

单位

说明

VDDPST

GPIO电压

1.62

1.8

1.98

V

-

VIH

高电平输入电压

0.65*VDDPST

-

1.98

V

-

VIL

低电平输入电压

-0.3

-

0.35*VDDPST

V

-

VOH

高电平输出电压

1.35

-

-

V

-

VOL

低电平输出电压

-

-

0.45

V

-

 

3.3.5 SDIO电气参数

SDIO标准电气特性请参考标准协议《SD Specifications Part1 Physical Layer Version 6.00》中的章节6.6.5,电气特性完全符合SDIO版本特性规范要求。

 

3.3.6 PCIE电气参数

PCIe标准电气特性请参考标准协议《PCI Express Base Specification Revision 3.1》中的章节4.3,电气特性完全符合PCIe版本特性规范要求。

3.4. 接口时序

3.4.1 LPDDR4X 接口时序

3.4.1.1 写时序

  • 命令和地址相对于CK的写操作时序

对于 DDR 命令和地址相对于 CK 的写操作时序,tIS 为命令和地址到 CK 上升沿的建立时间,tIH 为 CK 上升沿到命令和地址的保持时间。

图 3.6 命令和地址相对于CK的写操作时序图

 

  • DQS相对于CK的写操作时序

对于 LPDDR4X DQS 相对于 CK 的写操作时序,tDSH 为 CK 上升沿到 DQS 下降沿的保持时间,tDSS 为 DQS 下降沿到 CK 上升沿的建立时间。

图 3.7 DQS相对于CK的写操作时序图

 

3.4.1.2 读时序

  • 命令和地址相对于CK的读操作时序

“命令和地址相对于CK的读操作时序”与“命令和地址相对于CK的写操作时序”相同。

  • CK相对于DQS的读操作时序

对于 LPDDR4X,CK 相对于 DQS 的读操作时序,tDQSCK 为有效 DQS 相对于 CK 的偏斜。

图 3.8 CK相对于DQS的读操作时序图

 

  • DQS相对于DQ的读操作时序

对于 LPDDR4X DQS 相对于 DQ 的读操作时序,tQH 是最早无效的 DQ 相对于DQS 的抖动。

图 3.9 DQS相对于DQ的读操作时序图

 

3.4.1.3 时序参数

LPDDR4X接口满足JEDEC标准协议,具体时序参数信息可参考JESD209-4-1以及JESD209-4B。

 

3.4.2 SFC 接口时序

图 3.10 SFC数据输入时序

 

图 3.11 SFC数据输出时序

 

QUAD Mode下,PAD_SFC_WP和PAD_SFC_HOLD的输入/输出时序可以参考以上输入/输出时序。

表 3.8 QUAD Mode下SFC接口时序参数

参数

最小值

典型值

最大值

单位

输入信号建立时间(TSU)

2

-

-

ns

输入信号保持时间(THD)

-

1/2 SCK cycle

-

-

输出信号延迟(TV)

-

-

8

ns

输出信号保持时间(THO)

-

SCK cycle

-

-

 

3.4.3 I2C 接口时序

I2C接口时序如下图所示:

图 3.12 I2C接口时序

具体时序参数参加下表:

表 3.9 I2C接口时序参数

符号

参数

最小值

典型值

最大值

单位

fscl

SCL clock frequency

-

-

100

kHz

tSP

Tolerate spike width on bus

-

-

100

ns

tBUF

Bus free time

4.7

-

-

us

tSU:STA

START condition set-up time

4.7

-

-

us

tHD:STA

START condition hold time

4.0

-

-

us

tLOW

SCL LOW time

4.7

-

-

us

tHIGH

SCL HIGH time

4.0

-

-

us

tr

SCL and SDA rise time

-

-

1.0

us

tf

SCL and SDA fall time

-

-

0.3

us

tSU:DAT

data set-up time

250

-

-

ns

tHD:DAT

Data hold time

0

-

-

ns

tVD:DAT

SCL LOW-to-data out valid

-

-

3.4

us

tSU:STO

STOP condition set-up time

4.0

-

-

us

 

3.4.4 GMAC 接口时序

Ethernet MAC支持千兆模式和百兆模式,千兆模式支持RGMII接口,时序图如图 3.13所示,参数如表 3.10所示。百兆模式支持RMII接口,时序图 3.14所示,时序参数如表 3.11 所示。

图 3.13 RGMII时序图示

 

表 3.10 RGMII时序参数典型值

符号

参数

最小值

典型值

最大值

单位

TskewT

输出信号的时钟偏移(发送端)

-500

0

500

ps

TskewR

输入信号的时钟偏移(接收端)

1

1.8

2.6

ns

TsetupT

输出信号的建立时间(发送端)

1.2

2

-

ns

TholdT

输出信号的保持时间(发送端)

1.2

2

-

ns

TsetupR

输入信号的建立时间(接收端)

1.2

2

-

ns

TholdR

输入信号的保持时间(接收端)

1.2

2

-

ns

Tcyc

时钟周期

7.2

8

8.8

ns

Duty_G

时钟占空比(1GHz模式)

45

50

55

%

Duty_T

时钟占空比(100/10MHz模式)

40

50

60

%

Tr/Tf

上升/下降时间(20-80%)

-

-

0.75

ns

 

图 3.14 RMII时序参数

 

表 3.11 RMII时序参数典型值

符号

参数

最小值

典型值

最大值

单位

Freq

时钟频率

-

50

-

MHz

Duty

时钟占空比

35

-

65

%

Tsu

信号到时钟上升沿的建立时间

4

-

-

ns

Thold

信号到时钟上升沿的保持时间

2

-

-

ns

 

图 3.15 MDIO接口写时序

 

图 3.16 MDIO接口读时序

 

表 3.12 MDIO时序参数典型值

符号

参数

最小值

典型值

最大值

单位

Tclk

时钟周期

 

400

 

ns

Duty

时钟占空比

40

 

60

%

Tsu/Thold

信号的建立时间与保持时间

10

 

 

ns

Tskew

信号到时钟的延迟时间

0

 

300

ns

 

3.4.5 eMMC/SDIO 接口时序

SDR模式下数据输入输出时序图如下图所示:

表 3.12 MDIO时序参数典型值

符号

参数

最小值

典型值

最大值

单位

Tclk

时钟周期

 

400

 

ns

Duty

时钟占空比

40

 

60

%

Tsu/Thold

信号的建立时间与保持时间

10

 

 

ns

Tskew

信号到时钟的延迟时间

0

 

300

ns

 

图 3.17 EMMC/SDIO SDR接口时序

 

DDR模式下数据输入输出时序图如下图所示

图 3.18 EMMC/SDIO DDR接口时序

 

HS400模式下数据输出时序图如下图所示

图 3.19 EMMC HS400接口时序

 

SDIO/eMMC时序参数表

 

表 3.13 SDIO/eMMC时序参数典型值

速度模式

频率

Min hold

Min setup

TODLY

HS SDR

50MHz

3ns

3ns

13.7ns

HS DDR

50MHz

3ns(CMD)

2.5ns(DAT)

3ns(CMD)

2.5ns(DAT)

13.7ns(CMD)

7ns(DAT)

HS200

200MHz

0.8ns

1.4ns

NA

HS400

200MHz

0.4ns

0.4ns

NA

SDR104

200MHz

0.8ns

1.4ns

NA

SDR50

100MHz

0.8ns

3ns

7.5ns

DDR50

50MHz

0.8ns

6ns(CMD)

3ns(DAT)

13.7ns(CMD)

7ms(DAT)

SDR25(HS)

50MHz

2ns

6ns

14ns

SDR12(DS)

25MHz

5ns

5ns

14ns

 

4. 来料包装信息

来料包装信息说明来料包装信息说明来料包装信息说明来料包装信息说明来料包装信息说明来料包装信息说明来料包装信息说明

4.1. 来料包装信息说明

MLU220芯片采用tray包装方式,每个tray最多可摆放119颗芯片,tray采用5+1包装方式,每个内箱最多可以packing 595颗芯片,每个外箱最多可以放置6个内箱,最多可以packing 3570颗芯片。

Tray图纸请参见图4.1。

图 4.1 Tray Drawing

 

申 请 试 用