英特尔首次推出针对AI工作负载的Stratix 10 NX FPGA
英特尔今天推出了其首款经过AI优化的FPGA – Stratix 10 NX,它具有扩展的AI Tensor模块(30个乘法器和30个累加器),集成的HBM存储器和高带宽网络。新芯片继续利用英特尔的小芯片架构,并且该芯片的FPGA部分使用英特尔的14纳米技术制造。
英特尔报告称,新的FPGA将提供比Stratix 10 MX多15倍的INT8计算能力.Stratix 10 MX于2017年末推出,其DSP模块只有两个乘法器和两个累加器。新芯片还具有“高达57.8 Gig PAM4收发器和硬核英特尔以太网模块的高效率”。英特尔称,Stratix 10 NX将于今年晚些时候上市。
“出现的最具破坏力的趋势是AI模型的大小和复杂性呈指数级增长,”英特尔数据平台事业部可编程解决方案事业部总经理,企业副总裁David Moore在媒体预告中说。“我们看到的是,AI模型的复杂度每三个半月翻一番,或者每年翻一番。因此,在BERT 和 GPT之类的最大和下一代变压器模型中,它的参数将达到数百亿甚至更多 。”
“我们当前的(MX)计算模块实际上是为通用计算而设计的。因此,它具有广泛的灵活性,可以满足各种信号处理应用程序,操作和精度[要求]的苛刻要求。AI张量块的设计专注于加速AI应用程序,优化有效的张量流水线以及降低AI空间中常用的精度,整数和浮点格式。这些创新使我们能够将15倍的计算量打包到与标准DSP计算块相同的空间中。”
在更专业的应用领域中,FPGA有望作为低成本,高性能器件发挥越来越大的作用。FPGA的优势之一是能够实现低延迟处理并降低与通用CPU中未使用的硅片相关的成本。长期以来,由于难以编程/开发而享有盛誉,较新的工具使FPGA开发更加容易。到目前为止,仍然没有实现希望FPGA能够导致更普遍的可重配置系统的希望。
“我们通常会看到FPGA在实时,低批量应用中与众不同。因此,FPGA的灵活性和可配置的存储器层次结构使开发人员能够真正定制其设计,以创建优化的低延迟解决方案。”
针对Nvidia,英特尔表示,用于BERT批处理的Stratix 10 NX器件比Nvidia V100 GPU快2.3倍,在LSTM批处理中快9.5倍,在ResNet50批处理中快3.8倍。(请参见下面的幻灯片)
英特尔现已全面向异构架构迈进。Moore表示:“很明显,至强,人工智能和FPGA开发人员社区正在聚在一起解决异构计算难题。我们的重点不仅包括用于硬件和软件集成的工具,还包括从标准库和框架集成这些工具以无缝支持应用程序开发的工具。”
英特尔将赌注押在oneAPI(它正在倡导的基于标准的统一编程模型)上,以促进异构Xeon平台与各种加速器(如FPGA)的集成。
当被问及NX与MX有何不同以及与Microsoft的Project Brainwave * 完成的英特尔FPGA开发工作有何关系时 ,Moore将NX描述为MX和Microsoft工作的演变,而不是与众不同。
当然,英特尔近年来已收购了多家加速器公司和技术,包括最近的Habana Labs。
在简报中被问及关于Habana的计划时,英特尔公司副总裁兼至强和内存事业部总经理Lisa Spelman说:“ Habana专注于AI培训或推理工作量。我们的数学和TCO计算表明,当您查看工作负载流时,如果AI成为工作负载的[足够高]百分比,则可以通过加速或专用加速来补充基础处理器,从而提高经济效益。[它]与工作量的大小,要通过训练功能或推理尝试处理的数据量以及工作量的流有关。
“有些东西,就像我再次提到推荐系统一样,因为工作量的流以及将响应内置到响应中的方式,CPU实际上是这些工作量降落的最自然且最有可能的位置。如果您认为[潜在的]在非常特定的培训环境中进行图像处理,那么像Habana这样的专用于手头任务的加速器可能会成为最佳的总拥有成本模型,即使该模型仅用于较窄的部分中。问题。”
*微软Project Brainwave:
“ Brainwave项目是一个深度学习平台,用于在云和边缘上进行实时AI推理。基于高性能现场可编程门阵列(FPGA)的软神经处理单元(NPU)加速了深度神经网络(DNN)推理,并应用于计算机视觉和自然语言处理中。Brainwave项目正在通过使用互连的,可配置的,由可编程芯片组成的计算层来扩展CPU,从而改变计算方式。
“例如,这种FPGA配置在Bing的RNN上在延迟和吞吐量方面实现了超过一个数量级的改进,而无需进行批处理。通过提供实时AI和超低延迟而无需批量处理,可减少软件开销和复杂性。”
热点推荐
- · 看看在黑暗中发光的三菱Evo汽车
Dip Your Car进行了一项实验,将三菱Evo转变为夜光汽车,其结果发布在同名的YouTube频道上。事实证明,将荧光漆涂在具有光亮层的身体上并
- · Memoji现在可以在最新的苹果iOS 1...
我认为这是我们只能与Emojis聊天的时候了,您的朋友仍然会理解您要说的话。如今,随着疯狂的表情符号数量的增加,您可以从表情符号选项卡中
- · 联想使用高通Snapdragon 865制造...
根据在weibo com上发布的图像,看来联想可能会推出自己的游戏智能手机,该智能手机将配备高通公司的顶级Snapdragon 865芯片组。此外,发布
- · 新消息确认荣耀X50Pro5G智能手机的...
昨天,realme宣布将在线发布 realme X50 Pro 5G。但很明显,该公司无意放弃这种戏弄,最新消息证实该智能手机的显示屏将具有90Hz的刷新
- · 在2020年亚马逊Prime Day期间可获...
亚马逊2020年Prime Day为各种耳机带来了很多优惠,包括索尼的新型WH-1000XM4无线耳挂式耳机,该耳机具有市场上最好的噪音消除功能。这套特
- · 索尼最好的降噪耳机在Prime Day上...
如果您从Verge链接购买商品,Vox Media可能会赚取佣金。请参阅我们的道德声明。2020年黄金日的第二天也是最后一天,但接下来的几个小时仍
- · Spotify现在拥有自己的iOS 14小部件
自iOS 14发布以来的几周内,越来越多的应用程序在增加新功能,以利用Apple最新更新中的功能。现在,Spotify也加入了。今天,领先的订阅音
- · 苹果TV应用程序出现在Sony的一些最...
如果您从Verge链接购买商品,Vox Media可能会赚取佣金。请参阅我们的道德声明。苹果的Apple TV应用程序首次进入了Android TV。索尼宣布
- · 宏G支持G-Sync的27英寸4K 144Hz游...
如果您从Verge链接购买商品,Vox Media可能会赚取佣金。请参阅我们的道德声明。宏A在亚马逊上的27英寸4K Predator游戏显示器的闪电交易持
- · 谷歌Glass正在添加Meet 以便远程...
您可能已经有一段时间没有考虑过Google Glass了,但其抬头显示器的企业版却有了一个巧妙的新技巧:它将能够使用Google Meet(以前称为Hang
- · 贝尔金的首批MagSafe产品是外观精...
苹果公司新的MagSafe配件生态系统还没有建立一天,但是Belkin已经开始使用新的使用磁性充电系统的充电配件,并推出了新的BoostCharge Pro
- · 谷歌的新手势系统将可用于所有Pixel设备
除了触摸屏幕或按下按钮外,我们还有许多其他方式可以与智能手机进行交互。借助最新的Google Pixel 4 系列的Motion Sense ,我们可以
- · 华为于2020年推出其6nm麒麟820 5G芯片
华为最近宣布,他们可能会推出新的麒麟820 5G芯片组,该芯片组将在2020年2月24日晚上9点举行的在线会议上揭晓。根据gizchina com的声明,
- · 华为将开发一款具有多达8个摄像头...
最近花姐发现有诸多的小伙伴们对于华为将开发一款具有多达8个摄像头传感器的智能手机吗这个问题都颇为感兴趣的,大家也都想要及时了解到华
- · 配备64MP AI Quad相机的荣耀6系...
realme在其官方网站上发布了一张图片,其中提到realme 6系列(包括realme 6以及Pro变体)将于2020年3月5日发布。虽然关于上述智能手机的完
- · 未来的智能手机会使用用户可更换的...
根据fd nl上的一份报告,看来欧盟正在制定一项提案,要求智能手机具有用户可更换的电池。这是由于以下事实:用户通常将旧的智能手机换成较
- · FlyPods 3是HONOR为您呈现的全新...
除了HONOR View 30 Pro 和HONOR 9X Pro,HONOR在巴塞罗那举行的发布会上也给我们带来了另一个惊喜。该公司已经宣布了名为HONOR FlyP
- · LG推出V60 ThinQ 5G智能手机和改...
大约两周前,我们得到了LG即将推出的旗舰智能手机的渲染图 ,暗示了其内部外观。好吧,渲染似乎很准确。LG正式发布了V60 ThinkQ 5G,已
- · 据说苹果的2020年WWDC将举行 传闻...
由于使用了COVID-19病毒,该疾病已成功地减慢了速度,并取消了大多数事件。最近的一次是2020年世界移动通信大会,也有谣言说东京奥运会也将
- · 三星为下一代智能手机推出12GB LPDDR4X DRAM
三星宣布将发布其用于下一代智能手机的新型12GB LPDDR4X DRAM,该芯片旨在用于未来的手机。我们可以预计,今年新的12GB LPDDR4X DRAM将