8月2日,浙江大学脑机智能全国重点实验室重磅发布最新研制的新一代神经拟态类脑计算机—Darwin Monkey(”悟空”)。该类脑计算机搭载了960颗实验室自研的达尔文3代类脑计算芯片,支持的脉冲神经元规模超过20亿,神经突触超过千亿,其神经元数量已接近猕猴大脑规模,向更高级的类脑智能又迈进了一步,在典型运行状态下功耗约为2000瓦。这也是国际上首台神经元规模超过20亿的基于专用神经拟态芯片的类脑计算机。此前,国际上规模最大的神经拟态类脑计算机是Intel在2024年4月发布的Hala Point系统,其神经元规模为11.5亿。这标志着我国在神经拟态类脑计算机领域已达到国际先进水平。

该项成果也是浙江大学类脑计算团队继2020年9月份研制成功我国首台亿级神经元类脑计算机Darwin Mouse(“米奇”)之后,取得又一重要突破。
Darwin Monkey所采用的达尔文3代类脑计算芯片由浙江大学牵头、联合之江实验室于2023年初研制成功,单颗芯片支持超过235万脉冲神经元与亿级神经突触,并支持类脑计算专用指令集和神经拟态在线学习机制。
在类脑计算芯片的基础上,为了构建超大规模的类脑计算机Darwin Monkey,团队经过两年多的攻关,在以下关键技术上取得突破:
构建了大规模神经元系统互连与集成架构,支持以多维网格为基本拓扑结构的层次化、可扩展芯片间互连。
实现自适应时间步控制方法,支持大规模神经元之间的任务协同运行。
采用国产晶圆基板工艺,基于CoWoS-S 2.5D先进封装技术,实现晶圆级类脑计算芯片。
提出分层的系统资源管理框架,设计多级内存系统中的数据换入换出策略,实现对大规模神经元系统资源的管理与调度。
整台Darwin Monkey类脑计算机由15台刀片式神经拟态类脑服务器组成,每一台刀片式类脑服务器内部集成了64颗达尔文3代类脑计算芯片。刀片式类脑服务器的集成方式除了基于传统PCB板级互连的方式之外,为了突破芯片间互连速度与系统能效的瓶颈,团队联合浙大集成电路学院,利用2.5D先进封装技术研制出晶圆级超集成类脑计算芯片DarwinWafer,搭建了基于DarwinWafer的晶上系统(System on Wafer,SoW)刀片服务器,整个SoW刀片式服务器主体仅仅包含一张集成64颗达尔文3代类脑计算芯片裸片的12寸晶圆,摆脱了传统光罩的物理约束,实现导线微纳尺度的互连优化。

与此同时,为了充分释放类脑计算机的能力,团队还研制了新一代达尔文类脑操作系统。该系统采用分层资源管理架构,通过构建负载感知调度算法与动态时间片划分机制等技术,在考虑通信带宽与任务特征的基础上,实现了神经拟态任务的高效并发调度与系统资源的动态优化。
在该类脑计算机上,团队已成功部署多项智能应用,不仅能够运行DeepSeek类脑大模型完成逻辑推理、内容生成和数学求解等智能任务,还凭借其强大的神经元和突触资源,初步模拟了包括秀丽线虫、斑马鱼、小鼠以及猕猴等不同神经元规模的动物大脑,为脑科学研究提供了新的手段。
Darwin Monkey(悟空)类脑计算系统的推出,是浙大类脑计算团队在神经拟态计算领域的有一次突破,其大规模、高并行、低功耗等特点,将为现有的计算场景提供了新的计算范式:
为人工智能发展提供新的算力基座:类脑计算系统可以解决现有深度网络及大模型高能耗、高计算量的问题,同时其无人监督的在线方式学习机制能为人工智能带来革命性的进步;
作为脑模拟的天然平台,助力脑科学的发展:在脑科学的研究方面,Darwin Monkey能够作为神经科学家研究脑的仿真工具,提供新的实验手段探索大脑工作机理,用于更好地理解大脑,能够减少真实的生物实验;
推动通用人工智能的发展:人类的推理能力和效率远超当前人工智能,Darwin MonKey计算机仿脑的工作机制和超越人脑的运算速度,将为未来类脑AI的研究提供强大的支持。