MLU220快速上手指南

MLU270快速上手指南

此文档将帮助您在拿到MLU270产品后,快速能安装硬件并且建立开发环境。

1. 介绍

思元270采用寒武纪MLUv02架构,可支持视觉、语音、自然语言处理以及传统机器学习等多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。

下图中,左边深灰色为MLU270-F4,右边浅灰色为MLU270-S4。

2. 快速上手步骤

您想要快速完成基于MLU270的Demo演示,大概会经历以下步骤:

 

准备工作:安装MLU270所需要的硬件环境确认;

第一步:登入AI Repo,权限升级,获得软件下载权限;

第二步:硬件安装与检查;

第三步:软件栈安装;

第四步:运行Demo。

 

对应步骤请参考本文档后续详细介绍。

 

注:若您对边缘侧产品感兴趣,您可以关注MLU220系列产品。请点击MLU220快速上手文档,查看关于快速安装MLU220的指导。

 

在您完成基本功能验证后,若您需要进阶开发,或您需要论坛的技术支持,您可参考下面的链接汇总以获得更多信息。

3. 在线资源汇总

在开始使用前,您可以抽时间先了解以下链接,了解寒武纪的整体产品和软件体系。

 

关于寒武纪整体产品介绍的视频,时长约8分钟:

https://developer.cambricon.com/index/curriculum/details/id/6/classid/7.html

 

关于寒武纪软件栈的介绍视频,时长约21分钟:

https://developer.cambricon.com/index/curriculum/details/id/23/classid/7.html

 

寒武纪全部在线课程链接:

https://developer.cambricon.com/index/curriculum/index/classid/7.html

 

寒武纪技术文档下载:

https://developer.cambricon.com/index/document/index/classid/3.html

 

获取进一步技术支持,问题交流与反馈,寒武纪开发者论坛:

http://forum.cambricon.com/

 

软件栈SDK下载Cambricon AI Repo:

https://cair.cambricon.com/

 

论坛产品答疑专区:

http://forum.cambricon.com/index.php?m=content&c=index&a=lists&catid=132

 

4. 安装MLU270 需要的硬件环境

PC机环境

推荐配置

  • CPU:i7 8700K 或同等性能
  • 内存:16 GB以上
  • 固态:500GB以上
  • 主板:可以支持 x16 PCIe Gen.3接口
  • 机箱:全尺寸机箱可以容纳MLU270 F4卡
  • 电源:500W 或以上

装机前需要检查PC机箱大小是否满足板卡的规模

  • MLU270 F卡(主动散热,需要外接电源)规格(mm):267.00 * 111.15
  • MLU270 S 卡规格(mm):167.50 * 68.90

 

* 其他注意事项:

  • MLU 板卡无独显功能,需要搭配集成显卡的 CPU 进行显示
  • 主板需要支持启用芯片组 64bit 兼容性硬件物理寻址(较新的PC机主板以及服务器一般都支持)

查看方式:如果没有为板卡分配到内存,第一步可以进入Bios模式打开Above 4G Decoding 开关。如果打开依然没分配到,第二步再去查看启动参数 cat /proc/cmdline 是否有设定 pci=realloc=on;

  • CPU 需要支持 avx2(高级适量扩展) 和 f16c(半精度数据类型) 的指令集

查看方式:cat /proc/cpuinfo | grep -E 'avx2|f16c'

 

服务器:

  • X86服务器:MLU270 S 卡规格(mm):167.50 * 68.90
  • 带有 PCIE x16 gen3 插槽的转接板
  • CPU 需要支持 avx2(高级适量扩展) 和 f16c(半精度数据类型) 的指令集

查看方式:cat /proc/cpuinfo | grep -E 'avx2|f16c'

 

软件环境

  • 系统版本(适配的版本):
    • Centos系统:centos 7.2 - 7.8;
    • Ubuntu/debian 系统:ubuntu 16.04.1(4.0-31);ubuntu 16.04.5(4.4.0-112);ubuntu 16.04.5(4.13.0-36);ubuntu 18.04(4.15.0);ubuntu 18.10(4.18.0-25);ubuntu 19.04(5.0.0-36);ubuntu19.10(5.3.0-23);
  • 支持联网;
  • 支持安装 Docker 容器。

 

5. 快速上手步骤详解

第一步:Cambricon AI Repo使用

用以寒武纪软件栈下载的Cambricon AI Repo:https://cair.cambricon.com/

AI Repo的操作说明可点击用户登录旁边的用户手册按钮进行下载。如下图所示:

请注意目前寒武纪Cambricon AI Repo SDK下载仅针对企业用户开放。企业用户请在成功注册和登录进入AI Repo之后,点击屏幕右上方头像下的权限升级按钮,并提交您的真实信息,审核通过后即可下载SDK。如下图所示:

 

 

第二步:硬件安装

MLU270加速卡的安装首先请将加速卡插入主板的PCIE插槽。

其次对于MLU270 F4卡来说,由于PCIE接口供电不足,需要使用额外电源。MLU270 F4加速卡随机附带了一根类似上图中的电源转接线,可以将两路电源接入MLU270 F4卡。

硬件安装完成之后启动机器运行如下命令可以检查板卡是否被正确安装。

sudo lspci -v -d cabc:270

运行之后会显示:

 

第三步:软件栈安装

MLU270的软件栈安装请参考Cambricon AI Repo中如图的内容。其中非常详细的解释了各个软件栈部件的安装方式。

 

第四步:Demo运行

软件栈安装完成之后建议运行一些寒武纪开发者社区的Demo来帮助您熟悉整体的开发环境。Demo的内容包括了领域SDK,深度学习框架等。

开发者社区在线实验:https://developer.cambricon.com/index/curriculum/experiment/classid/8.html

 

目前社区提供多种Demo实验供您选择:

1. 基于PyTorch框架的Yolov5移植Demo:

https://developer.cambricon.com/index/curriculum/expdetails/id/10/classid/8.html

2. 视频编解码加推理Demo:

https://developer.cambricon.com/index/curriculum/expdetails/id/9/classid/8.html

 

MLU220快速上手指南

此文档将帮助您在拿到MLU220产品后,快速能安装硬件并且建立开发环境。

1. 介绍

思元220芯片基于寒武纪MLUv02架构,手指大小的标准M.2加速卡集成了8TOPS理论峰值性能,功耗仅为8.25W,可以轻松实现终端设备和边缘端设备的AI赋能方案。

上图展示了MLU220 M.2加速卡的产品形态。一般情况下MLU220 M.2加速卡需要配合工控机使用。

2. 快速上手步骤

您想要快速完成基于MLU220M.2的Demo演示,大概会经历以下步骤:

 

第一步:登入AI Repo,权限升级,获得软件下载权限;

第二步:硬件安装与检查;

第三步:软件安装(驱动及CNToolkit安装);

第四步:运行Demo。

 

对应步骤请参考本文档后续详细介绍。

注:您若想验证自己研发的算法,需使用MLU270环境进行模型转换及离线文件生成,具体方法请参见MLU270快速上手指南

在您完成基本功能验证后,若您需要进阶开发,或您需要论坛的技术支持,您可参考下面的链接汇总以获得更多信息。

 

3. 在线资源汇总

在开始使用前,您可以抽时间先了解以下链接,了解寒武纪的整体产品和软件体系。

 

关于寒武纪整体产品介绍的视频,时长约8分钟:

https://developer.cambricon.com/index/curriculum/details/id/6/classid/7.html

 

关于寒武纪软件栈的介绍视频,时长约21分钟:

https://developer.cambricon.com/index/curriculum/details/id/23/classid/7.html

 

寒武纪全部在线课程链接:

https://developer.cambricon.com/index/curriculum/index/classid/7.html

 

寒武纪技术文档下载:

https://developer.cambricon.com/index/document/index/classid/3.html

 

获取进一步技术支持,问题交流与反馈,寒武纪开发者论坛:

http://forum.cambricon.com/

 

软件栈SDK下载Cambricon AI Repo:

https://cair.cambricon.com/

 

论坛产品答疑专区:

http://forum.cambricon.com/index.php?m=content&c=index&a=lists&catid=132

 

4. 快速上手步骤详解

第一步:Cambricon AI Repo使用

用以寒武纪软件栈下载的Cambricon AI Repo:https://cair.cambricon.com/

AI Repo的操作说明可点击用户登录旁边的用户手册按钮进行下载。如下图所示:

 

请注意目前寒武纪Cambricon AI Repo SDK下载仅针对企业用户开放。企业用户请在成功注册和登录进入AI Repo之后,点击屏幕右上方头像下的权限升级按钮,并提交您的真实信息,审核通过后即可下载SDK。如下图所示:

 

第二步:硬件安装与检查

下图中展示的是一台MLU220工控机的典型形态。

下图中红色标出的部分就是已经插好的MLU220 M.2 加速卡。

在插有MLU220的机器中运行命令

sudo lspci -v -d cabc:0220

正常情况下会显示如下结果:

这证明MLU220 卡已经正确安装。下一步需要安装驱动。

 

第三步:CNToolkit及驱动安装

  • 驱动安装

驱动安装请登录Cambricon AI Repo,选择“思元220 基础软件包”,继续选择“MLU220_M.2_Driver”,在此链接中包含了驱动的下载链接,详细的安装方式和操作系统支持情况等信息。

另外也请参考文档中心的“驱动安装升级使用手册”:https://www.cambricon.com/docs/driver/index.html

 

驱动正确安装之后可以使用CNMON查看硬件状态。如下图所示:

 

  • CNToolkit安装

CNToolkit 是寒武纪 Neuware SDK 中的主要组件,为用户提供基于 BANG 架构的编译、调试、分析、运行的工具集。

CNToolkit安装请选择“思元220 基础软件包”,继续选择“MLU220_M.2_CNToolkit” 在此链接中包含了驱动的下载链接和详细的安装方式。

或者请参考CNToolkit安装升级使用手册:

https://www.cambricon.com/docs/cntoolkit/index.html

 

第四步:Demo运行

为了验证环境的正确性建议您在环境安装结束之后运行我们提供的部署示例。部署示例请选择“框架”,继续选择“思元220 部署示例”。其中包含了完整的demo下载和使用说明。

 

申 请 试 用