其实移动人工智能计算npu的问题并不复杂,但是又很多的朋友都不太了解移动端人工智能,因此呢,今天小编就来为大家分享移动人工智能计算npu的一些知识,希望可以帮助到大家,下面我们一起来看看这个问题的分析吧!
本文目录
npu算力排行榜
以下是NPU算力排行榜:
1.CambriconMLU270
2.HuaweiAscend910
3.GoogleTPUv4
4.NVIDIAA100TensorCoreGPU
5.IntelNervanaNNP-T
需要注意的是,这个排行榜只是一个参考,不同的应用场景和需求可能会有不同的选择。
联发科天玑1000+有npu吗?
天玑1000Plus规格全面解析!
7nm制程工艺
工艺制程直接影响到性能和功耗表现,先进的工艺制程是性能体验和能效体验的基础,也是广大手机用户的核心诉求。
2019年乃至如今2020年的绝大部分旗舰、次旗舰SoC都使用7nm制程。然而当去深究各家SoC的工艺时,会发现不同产品的7nm似乎存在些差别。
比如台积电的N7(N7FF)应用在了骁龙855、麒麟990、苹果A12;台积电N7P应用在骁龙865、苹果A13、天玑1000L;台积电N7+应用在了麒麟9905G;三星的7LPP应用在Exynos9825、骁龙765G。
其中台积电在2018年开始大规模量产7nm制程,刚刚提到的N7(或N7FF)即是最早的一批TSMC7nm方案,采用DUV,是初代方案。2019年台积电推出N7P,也就是第二代7nm,是N7初代方案的改良版,仍采用DUV以及一样的的设计准则。
N7+与N7P有所不同,它开始采用EUV极紫外光刻,按照台积电的说法,整体表现会优于N7。暂不清楚天玑1000Plus的7nm制程具体是采用了哪种方案,从天玑1000L采用台积电N7P来看,天玑1000Plus肯定也是如此。
——CPU
天玑1000Plus直接集成了四个Cortex-A77大核心、四个Cortex-A55小核心,频率分别为2.6GHz、2.0GHz,其中A77的性能相比A76提高了20%。
2018年的A76其实是ARM推出的一个非常成功的核心架构,全新的架构体系与7nmTSMC工艺的结合,带来了巨大的性能和效率飞跃,骁龙855就是很好的例子。
Cortex-A77是A76的直接继任者,新核心在很大程度上前代产品保持一致,在维持A76架构出色能效以及较小核心面积的同时,进一步提升了性能。A77架构依然采用ARMv8.2CPU核心,旨在与Cortex-A55小核心配对。此外,与A76相比,A77的基本配置也没有变化,依然可以看到64KBL1指令和L1缓存,以及256或512KBL2缓存。
总体而言,A77较A76的提升,没有A76较A75的提升幅度那么大,它依然是高性能高能效的产品的延续(可以看作A76的改良版)。
——GPU
GPU方面天玑1000Plus集成九个Mali-G77核心,性能相比G76提升多达40%,并支持90帧的吃鸡游戏和120帧的赛车游戏。
Mali-G77GPU,采用了全新架构Valhall。在此之前,从Mali-G71一直到Mali-G76采用的都是Bifrost架构,架构升级势在必行。事实上,相对比高通的AdrenoGPU,ARMMali的表现一直都差强人意。
从2016年,第一款基于Bifrost架构的Mali-G71宣布,并在Exynos8895应用时,外界就对其性能以及效能充满期待。但从最终表现来看,Mali-G71以及下一代Mali-G72都难称出色,这也直接导致当时采用其作GPU的SoC性能表现一般,明显落后与同时代的Adreno。
而Mali-G77GPU则采用了全新的Valhall架构设计,新架构带来了全新的ISA总线和计算核心设计,弥补了Bifrost体系结构的主要缺点。ARM官方称,Mali-G77较前代产品效能提升30%、性能提升30%、机器学习性能提升60%。每mm性能较A76预计提升1.4倍。在相同的工艺和相同的性能下,新的G77继续实现30%的同比能效改进,并且比Mali-G72节省50%的功耗。
这也意味着,Mali-G77的最终表现接近苹果A12的GPU性能,超越了高通Adreno640。
居于当前的移动GPU第一梯队。
——AI
AI已经成为移动平台的必备技能,联发科此前推出过NeuroPilotAI平台,设计了独立的APU(人工智能处理单元),可以是一两颗DSP,可以是NPU,也可以是其他组合,非常灵活。
经过HelioP60、HelioP90上的两代进化,天玑1000Plus集成的已经是第三代APU3.0,首次采用了两个大核、三个小核、一个微核的组合,更好地应对不同AI算力需求,并降低功耗,号称整体性能比上代提升2.5倍,功耗则降低40%。
其中,微核会始终开启,主要用于人脸检测,提升拍照时对于人脸的捕捉能力。可以看出天玑1000+是有NPU也就是AI的。
高通芯片怎么没有npu
高通芯片没有集成NPU(神经网络处理单元)的主要原因是其设计理念和市场定位。高通芯片主要专注于移动通信领域,如5G技术和移动设备的处理能力。虽然NPU在人工智能和机器学习方面具有重要作用,但高通芯片通过其他方式来实现任务,如使用GPU和DSP等处理器来处理相关计算。
此外,高通芯片还与合作伙伴合作,利用软件和算法优化来提供AI功能。因此,高通芯片没有集成NPU并不影响其在移动通信领域的竞争力和性能表现。
三星提出的NPU设计新思路,对降低移动设备的AI计算功耗有多大的作用?
作为当下最热的议题之一,人工智能(AI)总被许多电子产品制造商提起。最为技术领域的一个重大事件,其有望渗透从网络、到家庭、以及移动设备的各个方面。
然而受技术的限制,当前大部分商业人工智能应用仍依赖于云端后台,对安全、隐私和性能都有一定的影响。
有鉴于此,一些移动设备制造商有意为自家产品配备强大的NPU计算单元,以提升AI的本地体验,比如三星。
【题图viaSlashGear】
据悉,该公司最新的工作重点,就是通过较低功耗的神经网络处理器(NPU),实现设备上的AI处理。与传统深度学习模型相比,其通常需要缩小数据的分组。
三星表示,深度学习的数据分组为32位,能够反映传统的计算模型。对于芯片制造商来说,这显然需要堆砌更多的晶体管硬件,反之又加大了移动设备的能源消耗。
对于标配大容量电池的移动设备来说,这似乎不是一个大问题。但要让AI普及开来,就必须削减不必要的功耗,以减轻对更重要的应用的影响。
最终,三星得出的结论是,通过简单地将数据分组为4位、同时保持数据的准确性,以降低深度学习的硬件和功耗要求。
这种“量化间隔学习”的方法,有时甚至能够取得比服务器传输更准确的数据结果。根据该公司的数据,其能够晶体管的数量需求减少到1/40至1/120。
这意味着在手机等移动设备上进行AI处理将变得更为可行,而无需将负载转移到远程服务器上。其不仅减少了响应延迟,还降低了被窃听的风险。
遗憾的是,目前三星只宣布了NPU背后的技术,而不是NPU本身。预计新技术会嵌入到今年晚些时候宣布的下一款Exynos芯片中。
如果你还想了解更多这方面的信息,记得收藏关注本站。