6月11日,《Nature Chemistry》刊登了浙江师范大学李小波教授(一作兼通讯)的研究成果,下面,小编就首先介绍一下这位作者,然后带大家一起拜读一下他们的最新研究成果。
李小波2022年加入浙江师范大学任双龙特聘教授 (杨启华教授团队)。研究方向专注于光催化剂的开发及其在太阳能到化学能源转化,近年来结合人工智能、高通量及自动化等技术在光催化剂加速开发上进行了研究。自从加入浙江师范大学,李小波以浙江师范大学为通讯单位在Nat. Synth., Nat. Nanotechnol., J. Am. Chem. Soc., Chem.Comm.等SCI期刊上发表多篇文章。研究成果得到了国家自然科学基金、浙江省创新团队和浙江师范大学等经费资助。
用于优化多组分反应的物理编码贝叶斯助手
随着化学反应的复杂性增加,独立变量的数量也在增多,实验优化的难度显著增加。例如,光氧化化学可能涉及多个相互交织的催化循环,导致多组分反应的复杂性。尽管贝叶斯优化器等算法擅长处理多变量搜索空间,但如果不能捕捉到潜在的化学性质,就会在处理大型化学空间时变得低效。因此,需要创建一个本体来更好地将人工智能(AI)应用于化学领域。
值得一提的是,2024年3月8日,浙江师范大学李小波双龙特聘教授联合华东理工大学朱为宏院士团队、利物浦大学Andrew Cooper 院士团队在《Nature》子刊《Nature Synthesis》上在线发表研究论文“Accelerated discovery of molecular nanojunction photocatalysts for hydrogen evolution by using automated screening and flow synthesis”,间隔仅3个多月
数据驱动方法包括两个连续的闭环优化工作流程(图 1),两者都将预测性机器学习(ML)与算法控制下的实验相结合。该算法使用贝叶斯优化(BO)来探索搜索空间,并为后续实验提供信息。首先,作者设计了一个由 560 个潜在可合成有机分子组成的虚拟池,使用基于可靠且可多样化的 Hantszch 吡啶合成的通用分子支架(图 2)。作者使用分批式 BO 建立了一个可更新和查询的模型,以指导实验搜索最有价值的催化剂。通过这种迭代搜索策略,作者从总共 560 个候选分子库中合成了 55 个分子,目标反应的产率达到 67%。第二步,作者从合成的这些分子中挑选出 18 个进行反应条件优化,同时改变镍催化剂及其配位配体的浓度。在第二个 BO 模型的指导下,对 4,500 组可能的反应条件中的 107 组进行评估后,最高反应产率达到了 88%。
图1:用于发现金属光催化配方中OPC的顺序闭环BO的工作流程
候选 OPC 库
Hantzsch 吡啶合成法是一种多组分有机反应,由醛、2 等量的 β-酮酯和氮供体(如氨)生成吡啶化合物(图 2)。在此,作者将 20 个 β-酮腈衍生物和 28 个芳香醛结合起来,构建了一个包含 560 个分子的虚拟库,这些分子都有一个共同的氰基吡啶(CNP)核心,并由不同的化学分子官能化。这 560 个 CNP 分子原则上都可以合成(图 2)。这些化学和结构各异的 Ra 和 Rb 分子组合成 CNP 分子后,可产生 560 种不同的二元 Ra/Rb 组合,从而有可能在很大范围内调整 CNP 的光电特性和氧化还原电位。作者的目标是防止在设计 CNP 时出现类不平衡偏差,同时注意起始材料的可用性。
图2:560个候选CNP作为潜在光氧化还原催化剂的虚拟库
CNP 的氰基吡啶内核类似于氰基烯烃,其中许多都是已知的活性光催化剂。作者预计,这个多样化的 CNP 分子库中可能包含有前景的 OPC,可用于还原性和氧化性光氧化反应,如光氧化/镍双催化交叉偶联反应。然而,在从虚拟库中选择分子进行图 3a 所示的目标反应时,并没有清晰明确的物理原则可循。合成和测试所有 560 个 CNP 分子是不现实的。因此,作者开发了一种主动学习方法,利用闭环 BO 工作流程在实验和预测之间进行实时反馈,为实验选择 CNP(图 3b)。
使用 BO 选择合成目标
作者从560个CNP的虚拟库中选择目标,使用贝叶斯优化法探索CNP的编码化学空间,以提高反应产率。首先,通过Kennard-Stone算法选择了六种CNP进行初步测试,发现CNP-129达到了39%的最高反应产率。随后,作者建立了基于高斯过程的代用模型,每步选择6至8个CNP进行实验,共测试了49种CNP,将最高产率从39%提高到67%。发现ED Ra基团与CZ Rb基团配对效果最好,而含PA Rb基团的CNP表现较差。在双床真空变压吸附(VPSA)工艺中,SCS-800的C3H6纯度达95%,回收率83%,引入回流步骤后纯度提升至99.99%。这些结果表明SCS-800在工业规模下仍能有效分离丙烯和丙烷。进一步验证了BO算法在选择Ra-Rb对时的有效性,确认CNP-127是活性最高的光催化剂之一。此外,带有咔唑掺杂基团的CNP显示出较高的光催化产率。
图3:用于OPC发现的CNP的定向合成
了解光催化的关键分子特征
为了解释驱动定向合成 CNP 的 BO 的基本 GP 模型,作者使用了 SHAP解释框架。对于在第一个 BO 工作流程中合成和测试的 55 种 CNP(图 3),光吸收被认为是最有影响力的输入特征。小的光学间隙(良好的光吸收)与模型预测的正贡献有广泛的相关性(图 4a,b)。第二个最重要的特征是电子亲和力 (EA),当 EA 值较低和较强时,会产生较强的正贡献,而当 EA 值较高时,则会产生负贡献。EA 可估算 CNP- 在再生中间镍物种时的还原能力,中间镍物种随后会与芳基卤化物底物发生氧化加成。这是连接光氧化催化循环和镍催化循环的关键 SET 步骤。
图 4:SHAP 分析确定了光催化活性的重要分子特征
使用 BO 确定最佳反应条件
作者使用贝叶斯优化策略来优化脱羧C(sp3)-C(sp2)交叉偶联反应的整体条件,该反应需要光氧化催化剂和有机金属镍催化剂。初步测试中,CNP-129达到39%的最高产率。通过优化,CNP-127的产率从71%提升到88%。作者探索了三个关键变量:CNP光催化剂的选择、镍催化剂的浓度和镍配位吡啶配体的选择,共生成了4,500个实验条件。通过贝叶斯优化算法和实验测试,作者发现CNP-127在2-5摩尔%的镍浓度和4,4′-二甲基-2,2′-联吡啶配体(L2)下表现最佳,产率高达88%。与随机抽样相比,贝叶斯优化法更有效地探索了高效区域。
图 5:反应条件优化
对 CNP-127 的活性进行基准测试
为了确定最佳CNP的活性,作者比较了两种经典催化剂:4CzIPN和过渡金属催化剂Ir-cat(Ir[dF(CF3)ppy]2(dtbbpy))PF6(图6)。发现4CzIPN和Ir-cat在配体和镍负载方面的优化不如CNP-127彻底。整体而言,CNP-127在低镍负载量时产率较高,高负载量时产率略低,表现与Ir-cat相当且优于4CzIPN。有趣的是,4CzIPN和Ir-cat的活性随镍浓度降低而下降,而CNP-127的活性则随镍浓度从10%降至2%而逐渐提高。这可能是因为CNP-127的还原力较高,有利于电子转移。降低镍负载量有助于提高可持续性并减少金属残留污染。
图 6:针对已建立的光氧化还原催化剂对 CNP-127 活性进行基准测试
小结
实验性BO策略结合分子描述符,从560个候选分子的虚拟库中识别出了有前景的OPC,同时探索了部分化学空间。这种搜索确定了交叉偶联反应产率高达88%的OPC,与铱催化剂的产率相近。通过SHAP分析法对第一次BO活动中的代用模型进行解释,确定了有助于提高光催化活性的CNPs的重要分子特征。BO在发现金属光催化剂配方方面显示出巨大潜力,也适用于其他搜索空间大、先验知识有限的研究挑战。
来源:高分子科学前沿