IBM在2023年底整的类脑芯片

By Oceani Cheng on June 21, 2024

类脑芯片

0. 写在前面

  • 今天是夏至诶,白天最长的一天。最近这几天,七点半太阳还没落山,八点多甚至八点半天还是幽蓝的。
  • 昨天一下班就跑去朝阳大悦城看房子,买了蛋糕犒劳瑞虹和小喵。
  • 非常迅速的就签了合同,小悦中心,5900一个月。那个房子小喵和瑞虹都很满意,我也满意。
  • 来回打车花了好多钱,加上买蛋糕鸭脖什么什么的。晚上还叫了专车回来,请瑞虹和单炳耀吃了海底捞。单炳耀也不知道王者比赛怎么样。

1. 类脑芯片不是生物芯片

去年10月20多号,这两天,IBM低调地发了一个新闻,说自己又整了一款第二代类脑芯片 NorthPoleNorthPole采用12nm工艺技术,将220亿个晶体管256个内核封装在仅800平方毫米的面积内,在8-bit精度下每个计算单元每个周期可执行2048次操作,如果换成4-bit或2-bit精度,操作次数则翻倍,比8年前的第一代TrueNorth快约4,000倍。对比4nm节点实现的Nvidia H100 GPU相比,NorthPole能效提高了五倍,成为当之无愧是现在世界最强的AI芯片。 git

PCIe 卡上的NorthPole芯片(图片来源IBM网站)

所谓类脑芯片,仍然是全电子的,只是架构上抛弃了Van架构,并不是有个大脑被固定在芯片上然后插着一堆管子和电极。不过这种生物芯片也有人做类似的工作,2023年12月,印第安纳大学布卢明顿分校的一个团队搞出来个牛逼的玩意,将真实的人脑组织与电子设备相结合。 git

这才是生物芯片。

这应该是世界上第一个三维混合生物计算机,一种新型计算机体系结构。之前有实验用二维的神经元细胞培养能够完成类似的任务,而这是第一次在三维的大脑类器官中被证明。它本质上,其实是利用大脑类器官内的生物神经网络进行计算。。团队将人类多能干细胞被诱导发育成不同类型的脑细胞,这些脑细胞被组织成三维迷你大脑,称为类器官,具有完整的连接和结构,说白了就是在实验室中生长的真实人脑组织。但这不是真正的大脑,只是组织的简单排列,没有任何类似思想、情感或意识的东西。这不是个新方式,以前人们经常拿他来研究大脑的发育和工作方式(而不需要在真人身上瞎折腾)。

Brainoware把这些类脑器官连接到高密度微电极阵列上,使用一种称为“储备池计算”的人工神经网络。电刺激将信息传递到类器官中,在大脑意识以神经活动的形式进行计算之前,这些信息在类器官中被处理。普通的计算机硬件用于输入和输出层。这些层必须经过训练才能与类器官一起工作,输出层读取神经数据,并根据输入进行分类或预测。作为演示,研究人员给了Brainoware 240个音频片段,这些音频片段来自8位男性的日语元音,并要求它识别一个特定的人的声音(将音频转换为电能,传递给类器官)。经过两天的训练,Brainware 识别说话人的准确率达到了78%。他们还要求Brainoware预测厄农映射(Hénon map),这是一种表现出混乱行为的动力系统。他们让它在无人监督的情况下学习四天(每天代表一个训练时期),发现它能够比没有长短期记忆单元的人工神经网络更准确地预测映射。它的精确度略低于运行在人工智能上的纯硬件计算,但能解决简单的语音识别和数学问题。然而,目前仍有很大的限制,比如保持类器官的存活,以及外围设备的功耗水平。但是,考虑到伦理问题,Brainoware 不仅对计算有影响,而且对理解人类大脑的奥秘也有影响。这个工作发在了《Nature Electronics》上。

2. 类脑芯片是神经形态计算

2.1 仿生

现代计算机以冯·诺依曼架构为基础,其内存和处理单元都是相互独立,以总线为数据通道。冯·诺依曼架构的优点是简化了芯片设计,而且善于处理串行逻辑和数学问题,但内存和处理器之间的数据传输会受到总线能力的限制:因传输速度不及处理速度出现“冯·诺伊曼瓶颈”。这种老掉牙的架构已经快一百年了。近年来,地球人民一直试图通过设计硬件和算法模拟大脑的结构和工作方式,从而抛弃Van架构,实现接近大脑的能力。类脑芯片就是一种高度模拟人脑计算原理的芯片,基于对现代神经科学的理解,反复思考如何从晶体管到架构设计,算法以及软件来模仿人脑的运算。如果把类脑芯片做得更像人脑,就会被赋予一个新的名字 —— 神经形态计算(Neuromorphic Computing)类脑芯片NorthPole就是神经形态计算的结果。神经形态计算正在不断改进,但它耗能很大,而且训练人工神经网络非常耗时。所以,看境界,那个Brainoware的境界应该比神经形态计算就高了一重了。

人脑没有单独的存储器,没有动态随机存取存储器,没有哈希层级结构,没有共享存储器等等,相反,大脑脑细胞每一个都是运算、处理、储能、储存单元。

所以IBM抄袭生物神经元计算和存储数据的方式(仿生),将计算模块存储信息的模块交织在一起,NorthPole的所有内存都是在芯片内部,允许每个计算核心像访问相邻的存储块一样轻松地访问远程存储块,架构上模糊了计算和存储之间的界限。这种仿生架构大大加快计算单元和存储单元之间信息交换的速度。

“大脑比现代计算机节能得多,部分原因是它在每个神经元中都存储着计算记忆。NorthPole融合了类脑计算和硅优化计算、计算和内存、硬件和软件之间的界限。在单个内核级别,NorthPole 显示为接近计算的内存,而在芯片外部,而从外部(输入-输出)来看,NorthPole像是一个活动的存储芯片,这有助于将NorthPole集成到系统中,并显著降低了主机上的负载。”IBM类脑计算首席科学DHARMENDRA MODHA表示。

2.2 超快

IBM研究院表示,由于芯片采用了ResNet-50神经网络模型,推理性能优于所有主流架构,超过了4nm工艺制造的GPU。根据IBM公司的测试结果:NorthPole在执行人工智能任务时,与目前市场上同类微芯片相对比,其速度达到其22倍,每瓦能效大约是其25倍,而占地面积却只有五分之一。目前最先进的工艺技术是2nm,Modha可能在未来几年除了基本的架构创新之外,NorthPole 还可以实施几代芯片处理技术,以不断提高效率和性能(挤牙膏呗,吗的,商业计划都写出来了)。

新芯片的速度和效率来自于其所有内存都位于芯片本身上。所以,NorthPole芯片的劣势是,数据传输只能从芯片本身中的内存中调取,一旦芯片必须从另外的地方访问芯片,那该芯片上的所有加速将被削弱,所有优势“化简为零”。另外一种称为“横向扩展”的方法可以让NorthPole支持更大的神经网络,方法是将它们分解为适合 NorthPole 模型内存的较小子网,并将这些子网连接到多个 NorthPole 芯片上。 这一段不太懂。

NorthPole的一个重要应用领域就是图像识别。没有冯·诺依曼架构的束缚,该芯片可能比市场上已有的其他芯片更快的处理AI推理,比如图像识别(安全监控、智能交通、医疗诊断等)和语音识别(自然语言处理)。

Modha说:

NorthPole在架构上,模糊了计算和存储之间的界限,使其更容易整合到系统中,而且明显减少了主机的负载。

IBM认为NorthPole的潜在应用可能包括图像和视频分析、语音识别,以及作为大型语言模型基础的神经网络(为ChatGPT等聊天机器人提供动力)。而这些人工智能任务可能会应用于自动驾驶汽车、机器人、数字助理和卫星观测等领域。

科学家们指出,IBM采用12纳米节点工艺制造NorthPole。目前CPU的最先进技术已经是3纳米,这表明这种受大脑启发的策略可能会带来进一步的收益。

IBM的科学家在2023年10月出版的《SCIENCE》杂志上详细介绍了他们的研究成果。

3. 类脑芯片的发展

全球学者、企业等关于类脑计算的研究一直在持续,只能说还是处于研究阶段。最早是在2009年初,美国DARPA开始投入SyNAPSE项目,该项目被IBM公司接手,目标是建立一个完整的类脑计算系统。IBM Almaden研究中心延用了传统的数字器件,也就是基于神经突触核心构建类脑芯片,并通过大量的实时应用来验证它的可行性。该研究还在2011年12月刊登在了《Scientific American》杂志。后来IBM提出了全新的计算机架构TrueNorth,设计了仿真模拟器Compass,在超级计算机上模拟突触核心网络运行,来验证该架构的可行性。在2014年的8月,《Scientific》杂志就刊登了IBM研发的系统级类脑芯片第二代 TrueNorth,能在降低功耗的情况下,处理速度大幅提升。

这个TrueNorth是基于 “神经突触核“网络 的计算机芯片,采用三星28nm技术,5.4亿个晶体管仅占用4.3平方米的面积。TrueNorth的关键单元就是神经突触核心,突触是学习和记忆的关键,同时也可以作为数据通路可以进行通信,且通信网络只是由事件驱动。TrueNorth架构拥有了处理器内存通信的基本架构,和人脑中的神经元和突触处理问题的方式一致,可以基于事件驱动并行完成运算、存储和通信。因此具有低功耗、并行性、通用性、广泛联系行、时空性和多模式性,可以完成大型复杂任务,在能耗、速度上均高于市面上的传统芯片。

但回到实际情况上,类脑芯片的突触电路在实现集成加工上是比较困难的,传统冯·诺依曼架构下的芯片以及存储方式更易实现。

发展历程:

  • 2014 年IBM推出第二代 TrueNorth
  • 2017 年Intel发布首款自主学习的神经拟态研究芯片 Loihi
  • 2019 年Neuralink发布自研的N1脑部传感器芯片,2020年又发布了第二代设备LINK V0.9
  • 中国企业以及学界也有深入研究类脑芯片,中科院、清华、北大,甚至咱北师大也相继成立“脑科学与类脑智能研究中心”。 清华团队推出天机芯片,“天机芯”把人工通用智能的两个主要研究方向,即基于计算机科学和基于神经科学这两种方法,集成到一个平台,可以同时支持机器学习算法和现有类脑计算算法。其实很垃圾。