技巧操作:Word横版打印怎么设置
GitHub开源社区最新公布的AMD ROCm开发库显示,AMD GPU将在未来加入对BFloat16(BF16)浮点指令的支持,相比现在的FP16浮点可带来巨大的飞跃。
目前,Intel Cascade Lake至强、Ice Lake酷睿处理器已经支持BF16,ARM下一代ARMv8 CPU架构也会加入。BF16虽然不属于IEEE标准规范,但它的优势正得到越来越广泛的验证和认可。
BF16可以视为精简版的FP32单精度浮点指令,使用8个有效位、8个阶位,内存和带宽占用减半,执行效率大大提升,同时又在性能方面远胜FP16,可以大大提升AI人工智能、ML机器学习、DL深度学习等应用的性能、效率,不再受限于FP16的性能、FP32的效率。
根据模拟,BF16相比于FP16带来的性能提升在不同运算类型中,少则可达1.6倍,多则能够超过4倍。
现代3D游戏渲染不太可能从BF16中获益,但是随着GPU越来越多地参与AI、ML、DL运算,BF16的加入必将会给AMD显卡带来强大的加成,未来值得期待。
郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。
相关阅读
猜你喜欢
-
操作方法:WPS电脑筛选功能怎么用
2022-04-29 -
使用说明:对话框中的圆圈表示
2022-04-29 -
使用说明:微信设置仅聊天怎么设置
2022-04-29 -
技术参数:iphone下载qq文件怎么安装
2022-04-29 -
技术参数:电信手机怎么定制彩铃
2022-04-29 -
参考手册:QQ群怎么打卡
2022-04-28 -
科技评测:vb中val什么意思
2022-04-28 -
技巧操作:vivox23和幻彩版区别
2022-04-28 -
实例教程:word出现红色波浪线
2022-04-28 -
自学教程:微信聊天键盘窗口怎么变小了
2022-04-28