人工智能芯片计算架构(人工智能芯片计算架构图)

大家好,关于人工智能芯片计算架构很多朋友都还不太明白,今天小编就来为大家分享关于人工智能芯片计算架构图的知识,希望对各位有所帮助!

本文目录

  1. al芯片主要分为
  2. 什么是AR人工智能芯片
  3. 存算一体化芯片简史
  4. 骁龙845没有内置NPU,为什么还说是第三代人工智能芯片?

al芯片主要分为

AI芯片主要分为三类:GPU、FPGA、ASIC。

GPU、FPGA均是前期较为成熟的芯片架构,属于通用型芯片。ASIC属于为AI特定场景定制的芯片。行业内已经确认CPU不适用于AI计算,但是在AI应用领域也是必不可少,另外一种说法是还有一种类脑芯片,算是ASIC的一种。

什么是AR人工智能芯片

AR人工智能芯片是一种专门为增强现实(AR)应用和人工智能(AI)任务而设计和优化的芯片。AR人工智能芯片融合了计算、图形处理和人工智能算法,以提供高性能的AR体验和复杂的AI计算能力。

存算一体化芯片简史

存算一体化芯片的发展可以追溯到1960年代的集成电路,其中最早的集成电路是由美国硅谷的JackKilby发明的。随着技术的发展,1980年代开始出现了完全集成的芯片,使得计算机更加紧凑,运行更快。此外,1990年代以来,芯片发展更加迅速,出现了可编程逻辑器件,使得芯片变得更加灵活,可以应用于多种领域。

到了2000年,存算一体化芯片的发展变得更加迅速,可以用于智能手机,智能家居,机器人等多种领域。

骁龙845没有内置NPU,为什么还说是第三代人工智能芯片?

去年阿尔法狗打败李世石,成功引爆了市场对于人工智能的普遍关注。而今年可以说时人工智能爆发式增长的一年,特别是集成人工智能内核的麒麟970以及苹果A11的发布之后,高通进一步在骁龙处理器上加码人工智能的也是必然。不过,此次发布的骁龙845并没有专门加入专用的人工智能核心。而是继续通过现有的CPU/GPU/DSP来加强对于人工智能的支持。

对此,高通高级副总裁兼移动业务总经理AlexKatouzian表示:“据我说知,华为的产品是获得的第三方授权,与高通实际下的功夫不同。高通从骁龙820就开始AI方面的研究,到骁龙845已经是的第三代了,而且AI计算效能是前一代的三倍。”同时,他表示,“高通没有独立的神经网络引擎单元,而是更弹性的机器学习架构,在通用平台内做内核优化,分布在CPU、GPU、DSP等每个单元上,从而可以针对不同移动终端提供弹性调用各个处理单元。”

确实,早在骁龙820的时候,高通就已经加入了与人工智能相关的骁龙神经处理引擎。在今年年初的骁龙835国内的发布会上,高通就表示,对骁龙神经处理引擎软件框架进行了全新升级,除了支持caff、coffe2,还包含了对GoogleTensorFlow等神经网络和模型框架的支持,以及对具有Hexagon向量扩展(HVX)特性的HexagonDSP的增强。增强了包括了对定制神经网络层的支持,以及对骁龙异构核心的功耗与性能的优化。

▲骁龙835的神经处理引擎

而骁龙845此次则采用了高通第三代的骁龙神经处理引擎,除了已支持的GoogleTensorFlow和FacebookCaffe/Caffe2框架之外,现在还支持TensorflowLite和新的ONNX,可帮助开发者轻松使用他们所选择的框架,包括Caffe2、CNTK和MxNet等。此外,骁龙845还支持GoogleAndroidNNAPI,还加入了对于FP32、FP16以及INT8数据类型的支持,能够更加高效的进行人工智能运算。

此次骁龙845的Cortex-A75/55都是基于ARM最新的DynamIQ技术,非常适合人工智能和机器学习,不仅可以更加自由的进行大核的配置和调配,而且ARM还还加入了针对人工智能的指令集和优化库,ARMV8.2版本的指令集将支持神经网路卷积运算,可以极大的提升人工智能和机器学习的效率。

据ARM透露,针对人工智能和机器学习的全新处理器指令集在采用DynamIQ技术的Cortex-A75处理器在优化应用后,可实现比基于现有的Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。

此次,高通也表示,骁龙845的Kryo架构CPU架构支持FP32以及INT8。而AdrenoGPU则支持FP32以及FP16,这也使得骁龙845的CPU和GPU都能够很好的进行人工智能运算。

不过,实际上,高通骁龙的人工智能运算主要是由其DSP来负责的,可以将高通的HexagonDSP看作是人工智能内核,而目前市面上不少的人工智能处理就是基于DSP的。

根据高通此前公布的数据显示,在进行DNN运算时,同样的一个算法在其GPU上跑的速度要比CPU快4倍,如果在DSP上则要比CPU快8倍。在能效方面,GPU运算要比CPU节省8倍,DSP则可节省25倍。显然,相比CPU和GPU来说,DSP更适合做人工智能运算。

此次,骁龙845的DSP则由原来的骁龙835的Hexagon682升级为了Hexagon685,不仅延续了对于TensorFlow、HVX的支持,也加入了对低精度的INT8的支持。

显然,性能更强大的Hexagon685DSP,再加上ARM的DynamIQ技术以及高通自己的GPU,也给骁龙845的人工智能性能带来了大幅的提升。

高通表示,骁龙845的人工智能计算效能已经达到了骁龙835的3倍。

作者:芯智讯-浪客剑

关于人工智能芯片计算架构,人工智能芯片计算架构图的介绍到此结束,希望对大家有所帮助。

人工智能芯片计算架构(人工智能芯片计算架构图)文档下载: PDF DOC TXT