Xanadu与Nvidia合作,运用PennyLane函式库和cuQuantum SDK加速量子模拟,而这是科学家第一次以超级电脑规模加速量子模拟,透过将量子模拟分散到256个Nvidia A100 Tensor Core GPU上,模拟高达36个量子位元的运算。
Xanadu的量子程式开发框架PennyLane,是一个开源的跨平台量子机器学习Python函式库,供研究人员能以机器学习函式库,诸如PyTorch和TensorFlow来设计量子电路,而这便能够无缝整合量子与古典运算,并使用量子运算的特性来加速机器学习工作。而cuQuantum SDK则是Nvidia所推出的软体开发工具组,能够加速量子运算的模拟与研究,搭配Nvidia GPU的运算能力,cuQuantum SDK可大幅提高模拟大型量子系统的效率。
PennyLane中将机器学习技术应用在量子计算上是一个新颖的想法,藉由PennyLane的扩充套件,研究人便可连接不同量子运算後端,因此PennyLane在推出之後便受到许多研究人员的关注,但是Xanadu开发人员提到,许多研究人员要求更多的量子位元。
而PennyLane在扩展模拟量子系统遇到的主要问题,便是资源使用的挑战,因为模拟量子系统使用状态向量模拟器(State Vector Simulator),其所需要的记忆体,随着模拟的量子位元数呈现指数成长,Xanadu研究人员提到,在桌上型电脑的极限就是30量子位元,再增加更多的量子位元,所使用的记忆体量便会超过高效能运算执行个体的最大记忆体容量。
在2022年的时候,研究人员开始在单个GPU上使用cuQuantum加速量子模拟,运算速度提升达10倍,而虽然GPU在模拟运算的效能上具有极大的优势,但是Xanadu研究人员提到,记忆体管理对GPU来说更为重要,虽然单一GPU的记忆体就可达96 GB,但可用装置记忆体最多只能容纳30到32量子位元系统的状态向量储存,为了模拟更大的系统,需要将状态向量分散在多个GPU上,连接所有GPU一起运作。
因此为了支援分散式向量模拟,以模拟更多的量子位元,Xanadu在新版PennyLane中添加MPI(Message Passing Interface )技术以及Nvidia cuQuantum SDK。
研究人员在美国国家能源研究科学计算中心(NERSC)的超级电脑Perlmutter,搭配使用PennyLane,在GPU丛集上高速进行量子模拟。在Perlmutter多达256个Nvidia A100 Tensor Core GPU上执行模拟程式,现可模拟约36个量子位元,达到目前其他研究模拟量子位元数的2倍。