还能这么玩?会打游戏的“水凝胶”,被Nature亮点报道!

2024-08-28
16:02:36
0
1592
涌现计算是一个受自然界中计算过程启发的领域,被描述为许多简单过程合作产生的高度复杂过程,或者一个系统的行为不依赖于其单个部分,而依赖于它们彼此之间的关系。人工神经网络是基于生物大脑的涌现计算行为而开发的。两者都是由简单机器组成的大型复杂系统,这些机器的相互作用产生了复杂的计算或思维。这些理论的扩展推动了储层计算的发展,并应用了物理非线性系统。储层计算技术可以在实用应用程序中利用自然界中的涌现计算。例如,用水波纹进行图像分析,用菌丝霉菌解决迷宫问题和用化学反应器作为逻辑门。然而,这些实例中并不表现出涌现记忆,以及通过关联学习在生物神经网络(BNNs)中观察到的行为。由于记忆有限,储层系统的改进能力受到限制。这意味着连续的任务,需要基于任务历史的行为,对储层来说过于复杂,无法产生任何有用的结果。然而,并非所有可能的储层介质都以这种方式表现。通过正确的任务和计算介质组合,是否可以实现类似于在BNNs中观察到的涌现记忆功能?此外,通过储层计算技术能够追求更复杂和细微的任务呢?

近期,雷丁大学Yoshikatsu Hayashi团队将生物神经网络(BNNs)中的记忆和计算理论应用到了离子活性聚合物(electro-active polymer,EAP)水凝胶上,利用离子迁移和结构重组的常见机制以及储层计算和无监督学习技术,将离子型EAP水凝胶通过定制的微电极阵列嵌入到Pong(乒乓)模拟游戏中游戏环境被编码成提供给水凝胶相应的刺激,记录的离子浓度被用作游戏世界中的运动命令。通过分析水凝胶在模拟环境中的行为,可提升在游戏过程中的性能。该工作以题为“Electro-active polymer hydrogels exhibit emergent memory when embodied in a simulated game environment”的论文发表在最新一期《Cell Reports Physical Science》上,并被Nature以“AI made of jelly ‘learns’ to play Pong — and improves with practice”为题,作为新闻报道。

基于离子迁移和电导率测量的记忆机制

记忆机制产生的原理如图1所示。聚丙烯酰胺水凝胶是一种活性物质EAP,其中的38个氢离子在水凝胶内充当活性剂。电场的刺激会导致水凝胶内自由能的增加,离子发生迁移以最小化系统的自由能。随着离子的移动,它们会拖动水分子,导致水分布的变化和凝胶的局部变形,这是由聚合物网络中渗透压和橡胶弹性之间的平衡驱动的。由于离子不断迁移到一个位置,局部膨胀率逐渐降低,进一步降低了自由能。这会产生滞后效应,导致凝胶对刺激产生复杂的动力学响应。

氢离子在电场刺激下迁移所需的时间相对较短,但在没有刺激的情况下扩散到均匀分布需要更长的时间。时间尺度的差异允许之前的刺激影响未来的刺激,因为离子分布在刺激之间持续存在,从而形成一种记忆形式。通过记录连续刺激前后的离子浓度,可以观察到刺激引起的“记忆”状态。离子浓度可以通过凝胶的电导率来测量。随着离子在某个位置聚集并且离子浓度增加,局部电导率也会增加。通过向特定位置施加小电压,电源上的电流与电导率成正比,因此与离子浓度成正比。通过利用两对相邻的电极,可以在同时测量电导率的同时施加刺激。

图1. 电刺激下的离子运动。

如图2所示,作者通过选择性电刺激实验验证了聚丙烯酰胺水凝胶的记忆行为。如图1的A段所示,记录的电流默认值约为0.8 mA,这是因为EAP水凝胶具有固有导电性。施加电场后,当电场被B段开头所示的传感电极对拾取时,电流立即上升到2 mA。刺激也导致自由能增加。因此,离子向电极对移动以最小化自由能。随着离子收集和电导率上升,电流消耗上升到2.4 mA,如B段所示,一旦刺激被移除,电流下降到默认值,如C段所示;一旦重新施加刺激,电流消耗立即上升到B段结束的点,如离子仍然保持其位置,如D段开头所示。这种观察到的行为表现出类似记忆的机制,其中通过凝胶内离子的重新分布将值“保存”到EAP水凝胶中。然后,可以在F段的开头再次看到这种行为,它从段D结束的地方继续。

图2. 选择刺激时电流随时间变化。

计算机和EAP水凝胶之间的闭环通信

BNN和EAP水凝胶之间的一种常见驱动机制是离子对刺激的反应迁移,从而在整个介质中产生离子的不均匀分布。离子迁移可以编码通过感觉运动回路中的刺激提供的信息,由此产生的离子不均匀分布可以表现为先前刺激的记忆函数。利用储层计算框架,可以在模拟游戏环境中使用基于Pong游戏的活动来评估EAP水凝胶内计算能力的性能。

如图3A所示,多电极阵列(MEA)用于连接EAP水凝胶与包含Pong游戏环境的计算机系统。电极阵列分为两个区域,用于通过在选定位置施加电场提供刺激作为凝胶的输入,并通过选定位置的电流记录输出。通过将区域划分为特定任务,将同一位置发生的不同任务的干扰降至最低。

通过这种硬件和软件的布局,建立一个闭环,计算机将游戏环境(表示为球的位置)输出到施加在凝胶上的多电极阵列,形成电场。作为响应,离子浓度由多电极阵列测量为电流,并提供给计算机和乒乓游戏以移动球拍。该闭环如图3B所示。

图3. 包含Pong环境的计算机和EAP水凝胶之间闭环通信的系统布局。

乒乓游戏的实现

凝胶的刺激区域充当储层框架的刺激层,由2×3阵列组成。为了将球的位置转化为刺激,游戏环境被划分为2×3的网格,如图4B所示。游戏环境中球的位置从计算机发送到MEA;当球穿过这些区域时,相应的电极对被激活以刺激该区域。

感测区域充当储层框架的读出层。电流传感器用于测量感测电极处的电流消耗。这些电流值如图4A所示,可以理解为球拍的驱动指令。记录的电流值使用在之前使用该设备进行实验期间从水凝胶记录的最大和最小电流值进行归一化。然后,根据这些归一化值在乒乓游戏环境中表示的位置计算趋势。将二次多项式拟合到3个点来生成趋势。这种趋势的峰值是凝胶中最高电流和最高离子浓度的预测点,也就是放置球拍的地方(图4C)。

从这些游戏中,作者记录了几个用于性能分析的指标,如电流测量、刺激位置和得分。如图4B所示,每当球拍成功击中球时,得分就会增加,每当球错过球拍击中墙壁时,得分会重置为0。将这些单独运行的所有数据合并到一个数据集中,以查看水凝胶的整体平均行为,并评估其性能和可重复性。

图4. 计算机中Pong游戏的软件展示。
图片
水凝胶在 24 分钟内提高了它在游戏中的表现
小结

该项研究结果表明,某些活性介质,如离子型电活性聚合物(EAP)水凝胶,其行为由与计算系统中发现的机制相似的驱动机制所控制,可以用于类似的计算应用。通过将这些介质应用于计算任务,并使用特定计算技术,EAP水凝胶可表现出一种类似记忆的功能,这有助于提高任务中的性能。这些结果为在其他具有类似自由能驱动机制的活性介质中实现复杂计算开辟了一条有前景的道路。


文章链接:
https://doi.org/10.1016/j.xcrp.2024.102151
来源:高分子科学前沿

声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!