行业文献

LITERATURE

发布日期:11/3/2025 8:30:00 PM

 

内容提要

   本工作提出了一个数据驱动的多阶段筛选工作流程,以快速发现针对RNA靶向肿瘤PDT的新型I型PSs。开发了两个定制数据库:一个用于训练第一类PS识别模型(1-PS-GCN),另一个用于人工智能(AI)辅助的多阶段筛选。确定了具有潜在的I型光敏特性、高合成可及性和RNA靶向能力的前10个候选化合物。专家和AI达成共识,选出最有前途的I型PS(PYD)。最终合成了PYD,并通过光谱、细胞和体内PDT实验对其性质进行了验证。它具有良好的光毒性和显著的肿瘤抑制作用。我们的方法建立了一种智能发现范式,以加速识别用于高级PDT的近红外I型PSs。

 

PS发现的数据集

   我们的目标是开发一个数据驱动的人工智能模型,能够准确地识别I型PSs,并随后从大量的近红外小分子数据集中筛选它们。为了实现这一点,从头开始构建了两个数据集:数据集1用于训练数据驱动的人工智能模型以识别I型PSs,数据集2用于高通量筛选。在PS数据集(数据集1)中,我们从过去20年发表的相关文献中收集了1009个独特的小分子PSs,其中包含224个I型PSs(阳性)和785个非I型PSs(阴性)。后者是使用最近亲缘关系(NoK)概念选择的,完全由II型PSs组成。此外,我们只考虑了小分子PSs,不包括络合物和聚合物。数据集1中的分子以8:1:1的比例随机分为训练集、验证集和测试集。训练集用于建立1-PS-GCN模型,验证集用于超参数调整,测试集用于评估模型性能。数据集2是一个近红外小分子数据集(2768个化合物),是通过扩展现有数据库和进行补充文献综述而构建的。值得注意的是,其中大多数没有被报告为PSs。图S1提供了数据集2的分子量和理化性质的详细分布。在建模之前计算所有分子的摩根指纹、物理化学描述符和分子图表示。

用于筛选I型PS的机器学习模型

   为了对I类PS和非I类PS进行分类,我们开发了六种二元分类模型,包括三种经典的机器学习模型:最近邻(KNN)、随机森林(RF)和支持向量机(SVM),以及三种深度学习模型:用于I类PS识别的指纹增强图卷积网络(1-PS-GCN)、深度神经网络(DNN)和卷积神经网络(CNN)。这些模型和超参数优化的详细信息总结在ESI和表S2–S4中。1-PS-GCN是我们开发的一种新颖的深度学习模型,它将分子摩根指纹与先进的图卷积网络集成在一起。其架构如图,利用RDKit包处理分子简化分子输入线输入系统(SMILES)序列,以提取分子图信息、摩根指纹和17种物理化学性质。两个图卷积层与全局平均池化相结合,用于提取分子图特征。这些特征与摩根指纹和物理化学特性一起连接成2129维特征向量,随后通过全连接层进行处理以进行分类。

 

NIRI型PS发现程序

   研究人员通常致力于设计具有多种理想特性的PS以满足实际应用需求。在这项研究中,除了基本的近红外特征外,我们还寻找易于合成并能够与RNA结合的PS,以增强PDT对肿瘤的疗效。因此,我们实施了多阶段筛选过程来发现具有多种所需特性的PS。多阶段筛选过程从1-PS-GCN模型开始,该模型从数据集2中的2768个分子中识别出782个I型PS,剩下的1986个被归类为非I型PS。说明了每个筛选阶段的数据量变化,使用基于摩根指纹的分布式随机邻域嵌入(t-SNE)降维来可视化数据集2的化学空间。该可视化演示了人工智能筛选过程,将广泛的化学空间细化为感兴趣的重点子集。I型和非I型PS在化学空间中表现出不同的分布,反映了有助于构建准确分类模型的结构差异。在第二阶段,使用合成可及性得分(SAscore)<3.5和分子量(MW)<400的阈值筛选分子的合成可及性。描绘了782个分子的SAscore和MW分布,突出显示了选定的范围。阈值3.5是根据我们数据集中SAscore的分布选择的,它对应于局部最大值。在此阶段之后,剩下60个易于合成的分子。最近的研究表明,某些RNA(例如rRNA、mRNA和G4sRNA)在肿瘤细胞中特异性富集。能够靶向RNA激活的光敏剂(PS)可以在富含RNA的区域特异性产生活性氧(ROS),从而增强对肿瘤细胞的精确有效杀伤。认识到RNA结合分子在PDT治疗中的治疗潜力,我们采用RSAPred平台来预测60个分子的对数尺度解离常数(pKd)值。保留了26个pKd>8的分子并根据它们的分数进行排名。由于机器学习模型提供概率预测,因此最终选择需要专家评估。两位专门研究PS和小分子荧光探针的专家评估了前10种候选材料的抗光漂白性、激发波长和结构独特性。基于这次专家与AI的合作,分子10号(PYD)因其刚性、抗光漂白结构以及与商业RNA检测试剂派洛宁的相似性而被选中,这表明它最有潜力成为高性能PS。

 

模型可解释性分析

   深度学习模型通常被视为“黑盒”工具,因为其预测性能令人印象深刻,但可解释性有限。揭示他们决策背后的原因仍然是一个重大挑战。在本研究中,我们尝试探索1-PS-GCN如何使用可解释性方法识别I型PS。该模型的混合架构将分子指纹和基于图形的信息集成在一起,进一步加剧了这一挑战。以选定的PYD分子为例,我们计算了其摩根指纹中各个特征的重要性。特征10、326和1376表现出较高的重要性得分,对应于图中确定的子结构。所有三个特征都与吡喃结构有关,可能是由于氧阳离子的强吸电子效应,从而增强了分子的分子内电荷转移(ICT)能力。这种结构特征似乎促进了I型PS的形成,与文献中的发现一致。此外,还采用图可解释性方法来评估分子图中每个节点(即原子)的重要性。最关键的基于图形的特征与分子的共轭结构相关,包括原子等属性。是环(环状结构),sp2(具有离域π电子的平面构型),总度数(3)(具有三个化学键的原子),以及如果该原子是芳香族(芳香族系统)。这些发现表明,模型的图形组件认识到在I型PS中产生分子荧光的基本共轭结构的必要性。这种可解释性分析为模型将PYD分子归类为I型PS的原因提供了初步见解。从数据驱动的角度来看,它为探索I型PSs形成的机制提供了一种有前途的方法。

 

   为了直观地展示模型的判别机制及其在特征空间中的决策边界,我们从1-PS-GCN模型的128维嵌入层中提取高维特征表示,并使用t-SNE算法进行二维可视化,在该图中,四种类型的样本进行了明显的颜色编码:真阳性(TP,红色)、真阴性(TN,蓝色)、假阳性(FP,黄色)和假阴性(FN,绿色),全面呈现特征空间中的分类决策分布。可视化结果显示,该模型在t-SNE投影中形成了相对清晰的簇结构,I型和非I型样本表现出良好的整体分离性。大多数TP和TN样本形成不同的簇,表明该模型可以有效地学习和区分高维特征空间中不同类别的结构特征。为了进一步加强决策边界的可解释性,我们专门选择了决策边界附近的几个代表性样本,并将其分子结构可视化。该图的左上部分显示了两种分子结构:一种TP样品和一种TN样品。尽管它们的框架具有某些结构相似性,但该模型成功地识别了它们的关键差异并做出了正确的分类,展示了其识别微妙结构特征的能力。此外,右下角显示的三个分子也位于决策边界附近。仅根据经验知识对这三种结构不同的分子进行分类是具有挑战性的。尽管如此,我们的模型有效地确定了它们的光敏类型,表明其在捕获潜在结构-功能关系方面的泛化能力。

体外表征

   为了验证AI专家共识选择的PYD分子具有RNA结合和I型PS特性,我们通过强酸条件下的缩合反应成功合成了PYD分子。我们研究了PYD的光物理性质。紫外可见吸收光谱分析表明,PYD在500至700nm范围内表现出强吸收峰。添加RNA后吸收峰发生红移,最大吸收峰在640nm附近,表明PYD与RNA发生了相互作用。为了验证PYD具有I型PS的特性,我们使用ROS2’,7’-二氯二氢荧光素(DCFH)的通用荧光指示剂对PYD和PYD+RNA系统进行实时照明(660nm,10mWcm−2)。实验结果表明,含有DCFH的PYD+RNA体系中530nm处的荧光发射峰强度随着光照时间的延长而逐渐增加,而在PYD体系中,DCFH的荧光强度仅随着光照时间的增加而出现轻微变化。接下来,我们使用各种特异性指标进行了更详细的调查。我们采用超氧阴离子(O2−•)指示剂二氢罗丹明123(DHR123)、特异性羟基自由基(OH)指示剂羟苯基荧光素(HPF)、单线态氧(1O2)指示剂单线态氧传感器绿(SOSG)和9,10-蒽二基-双(亚甲基)二丙二酸(ABDA)来进行实时照明(660nm,10mWcm−2)在PYD和PYD+RNA系统上。观察到,当用DHR123和HPF试剂处理时,PYD和PYD+RNA系统中ROS探针的荧光强度随着光照时间的延长而逐渐增加。此外,含有RNA的PYD系统中各种指标的荧光强度被发现比单独PYD系统中的荧光强度更强。然而,使用ABDA和SOSG试剂的PYD和PYD+RNA系统的紫外和荧光强度保持不变,表明通过照射PYD和PYD+RNA系统产生的ROS不是传统的PS产生的1O2,并且RNA增强了PYD产生的ROS。体外指示剂检测实验表明,PYD在暴露于光后可以有效地产生ROS,这表明其有望用于I型PDT。

 

细胞检测

   为了验证PYD的荧光可以被细胞RNA选择性激活,我们使用PYD和Hoechst对活细胞进行双荧光通道成像。共聚焦荧光图像显示乳腺癌细胞系(MCF7)的细胞质和核仁发出强烈的红色荧光,而细胞核则发出蓝色荧光。当用DNaseI处理MCF-7细胞时,观察到细胞核中的蓝色荧光显着丧失,而细胞中的红色荧光仍然存在。用RNaseA处理后,MCF-7细胞中的红色荧光几乎完全消失,但细胞核中的蓝色荧光基本保持不变。这些结果表明,PYD与细胞内的RNA结合后可以激活荧光。随后,我们利用MCF-7细胞研究PYD靶向活细胞中RNA进行PDT的能力。最初,我们进行了成像研究,以检查光照射下细胞中PYD产生的ROS。在光照射组中,MCF-7细胞表现出来自活化的2’,7’-二氯二氢荧光素二乙酸酯(DCFH-DA)的强烈绿色荧光。相比之下,未照射组和用N-乙酰半胱氨酸(NAC:一种有效的抗氧化剂)预处理的MCF-7细胞分别没有显示绿色荧光和显着减少的荧光。这些结果表明,在光照射下细胞内产生ROS。用PYD和O2-•指示剂氢乙啶(DHE)处理的细胞在光照后发出强烈的红色荧光,表明光照射后细胞内产生了O2-•。此外,我们将OH指示剂HPF与PYD结合使用,观察到光照后细胞中的特定绿色荧光,该荧光通过超氧化物歧化酶(SOD)抑制剂2-甲氧基雌二醇(2ME2)处理显着减弱。用1O2荧光探针SOSG处理的细胞在光照前后均未显示荧光。这些结果表明,PYD的光照射产生O2-•或者光照射过程中产生的O2-•被细胞内SOD催化歧化为OH,这与之前的报道一致。总的来说,这些发现表明PYD可以在活细胞内产生高活性的O2-•和OH

 

肿瘤小鼠模型和PDT

   为了进一步研究RNA靶向的I型PSPYD在体内抗肿瘤治疗中的潜力,我们通过将4T1细胞注射到BALB/c小鼠腹腔皮下组织中建立了荷瘤小鼠。PYD体内肿瘤成像的能力最初是通过瘤内注射进行探索的。肿瘤部位的荧光信号相当强烈,注射后6小时荧光强度持续保持在较高水平,表明PYD可以被肿瘤组织内的RNA激活而发出荧光,表现出出色的肿瘤成像特性。为了验证瘤内RNA对PYD的激活作用,对酶消化的肿瘤组织进行荧光成像分析,结果表明RNaseA处理后荧光显着降低,进一步表明瘤内RNA可以荧光激活PYD。PYD在小鼠体内的药代动力学特征对于肿瘤光动力疗法(PDT)实验至关重要。我们对PYD在小鼠体内的药代动力学特征进行了深入分析,实验结果表明PYD主要通过肝脏清除(血液半衰期为3.6分钟)。这一发现与大多数报道的小分子药物一致。我们评估了PYD对PDT的影响。患有4T1肿瘤的BALB/c小鼠被随机分为四组(n=4)。当肿瘤大小达到约50mm3时,给小鼠瘤内注射PBS(第II组)和PYD(第IV组)。然后对他们进行光治疗实验,与对照组相比,PYD联合光治疗的IV组肿瘤生长速度显着降低。对照组注射相同的PBS(I组)和PYD(III组),但不进行光处理。然而,注射PBS并接受光治疗的II组肿瘤生长速率并未受到影响,这表明RNA靶向激活的I型PSPYD与光疗相结合具有显着且高效的抑制肿瘤生长的效果,在肿瘤治疗领域具有巨大的潜在价值。最终,我们在14天的治疗期后解剖了小鼠的肿瘤,解剖肿瘤的照片进一步证明PDT治疗组表现出抗肿瘤作用。

 

结论

   我们提出了一种数据驱动的多阶段筛选工作流程,以快速发现具有所需特性的I型PS。构建了两个综合数据集:一个包含1009个分子,用于训练I型PS识别模型,另一个包含2768个NIR小分子,用于使用新开发的1-PS-GCNDL模型进行筛选。1-PS-GCN在测试集上表现出卓越的分类精度(0.8791),优于基线模型。利用该模型,我们成功鉴定了一组具有潜在NIRI型PS特性的候选分子。通过考虑可合成性、分子量和RNA靶向特性的多阶段筛选,专家和AI达成共识,将PYD确定为最有前途的I型PS。模型可解释性研究表明,PYD的I型PS特性可能与其吡喃结构和共轭体系有关,从而增强了其ICT能力。分子对接实验进一步验证了PYD的RNA结合特性。

参考文献

Data-driven discovery of near-infrared type I photosensitizers for RNA-targeted tumor photodynamic therapyWen Chen,Xiao-Qiong Mao,Xiao-Zhi Wang,Ya-Cong Liao,Xiao-Yue Yin,Hai-Long Wu,Tai-Yi Chen,Meng-Qing Liu,Tong Wang and Ru-Qin Yu, Chem Sci,2025, 16, 14455-14467, https://doi.org/10.1039/D5SC03648H.

上一篇:J. Am. Chem. Soc:采用储库-泵集成策略开发I型光敏剂 下一篇:Chin. Chem. Lett:双阳离型Cy 5.5衍生物用于808 nm高效抗肿瘤光动力治疗