当前位置: 当前位置:首页 > 实时快报 > NVIDIAcuTENSOR1.4现在可用于创建多GPUTensor操作 正文

NVIDIAcuTENSOR1.4现在可用于创建多GPUTensor操作

2024-10-22 16:50:46 来源:未焚徙薪网 作者:每日趣闻 点击:845次
导读 NVIDIAcuTENSORv1-4NVIDIA本周宣布了其cuTENSORv1 4的用于可用性,它现在支持高达64维的创建操作张量、分布式多GPU张量操作,用于并有助于改进张量收缩性能 NVIDIAcuTENSORv1-4NVIDIA本周宣布了其cuTENSORv1.4的创建操作可用性,它现在支持高达64维的用于张量、分布式多GPU张量操作,创建操作并有助于改进张量收缩性能模型。用于cuTENSORv1.4软件现在可以免费下载,创建操作让您可以查看其功能。用于cuTENSOR是创建操作用于张量基元的高性能CUDA库,其功能包括对具有FP32计算的用于FP64输入、具有FP16、创建操作BF16或TF32计算的用于FP32输入、复杂时间实运算和共轭(无转置)的创建操作广泛混合精度支持支持。NVIDIAcuTENSORv1.4新功能“cuTENSOR库是用于首创的GPU加速张量线性代数库,提供张量收缩、约简和元素运算。cuTENSOR用于加速深度学习训练和推理、计算机视觉、量子化学和计算物理领域的应用。”cuTENSORv1.4最多支持64维张量、任意数据布局和可简单序列化的数据结构,并支持各种激活函数、任意张量排列和不同数据类型之间的转换。最多支持64维张量。支持分布式、多GPU张量操作。改进的张量收缩性能模型(即,algoCUTENSOR_ALGO_DEFAULT)。改进了具有整体大收缩尺寸的张量收缩的性能(即,添加了平行缩减)。改进了具有微小收缩尺寸(<=8)的张量收缩的性能。改进了类似外积的张量收缩的性能(例如,C[a,b,c,d]=A[b,d]*B[a,c])。额外的错误修复。
作者:国际新闻
------分隔线----------------------------
头条新闻
图片新闻
新闻排行榜