英特尔将其 Python NPU 加速库开源

站长云网 2024-03-02 5iter.com 站长云网

英特尔已将其NPU加速库(intel-npu-acceleration-library)开源,作为Windows和Linux系统的用户空间库,用于与其新款MeteorLake笔记本电脑上的神经处理单元(NPU)接口。

英特尔长期以来一直在开发iVPULinux内核驱动程序,该驱动程序位于内核上游,用于从MeteorLake开始支持英特尔NPU(以前称为VPU)。这个NPU加速库是一个方便的Python库,可以充分利用NPU的潜力。

英特尔神经处理单元库支持8位量化、Float16支持、torch.compile支持、静态形状推理和其他功能。

NPU加速库可从GitHub下载,也可通过PIP方便地安装:

https://github.com/intel/intel-npu-acceleration-library

英特尔NPU加速库GitHub页面上的Python代码示例展示了在NPU上进行单矩阵乘法运算、为NPU编译模型,甚至在NPU上运行Tiny-Llama模型。随着人工智能时代的到来以及NPU在更多英特尔处理器上的应用,这个库将变得越来越重要。

责任编辑:站长云网