提高新药研发成功率的一个主要突破口是寻找新药研发的新技术,如近年来迅猛兴起的DNA编码化合物库(DEL)和人工智能(AI)技术等,其中,既往人工智能辅助药物开发(AIDD)最为人所知的案例是DDR1抑制剂的发现。然而,该案例中AIDD是基于前人已报道的大量活性骨架进行结构衍生,故难以突破骨架束缚而沦为fast-follow。在现阶段的应用中,高质量的化学结构-生物活性(亲和力)关系大数据是AIDD不能更有效加快新药发现进程的主要阻力。
另一方面,作为具备发现(First-In-Class)FIC苗头化合物的高通量筛选工具,DEL结合AI在近年已开始受到重视,但是目前已公开的文献报道案例极少,且已报道案例中DEL技术仅被用于较经典的激酶与受体类靶点的筛选, DEL结合AI并未被充分应用于发现潜在的FIC药物,尤其是难成药靶点以及没有或者极少已知活性分子的靶点。
近日,广东省小分子新药创新中心联合其孵化的深圳市新樾生物科技有限公司首次将DEL+AI应用于难成药靶点以及没有/极少已知活性结构的靶点,针对肿瘤免疫治疗领域内的知名靶点(TIGIT,蛋白-蛋白相互作用靶点,仅有极少已知活性结构),成功发现具有FIC潜力的活性化合物,并以DEL筛选以及首轮优化所获得的数据为基础,构建了效果优秀的AI模型,研究成果以“Discovery of TIGIT inhibitors based on DEL and machine learning”为题发表于国际知名SCI期刊Frontiers in Chemistry(影响因子5.545,https://doi.org/10.3389/fchem.2022.982539,,可复制该网页查看论文原文)。
图1 通过DEL筛选发现的全新TIGIT配体。a)DEL筛选后的二维DNA测序数据;b)DEL筛选发现的苗头化合物1的结构;c)苗头化合物1对TIGIT/CD155相互作用的阻断效果。
该研究利用AI技术对DEL针对TIGIT靶点筛选所产生的含极少量阳性样本的大数据进行分析,通过对比分析包括a)指纹图谱分子生成,b)过采样,c)欠采样组合等方法扩增阳性样本比例,最终基于极少量的活性化合物,成功建立LightGBM与MLP两个AI模型,并且在测试集具有令人满意的表现(~75%的高命中率)。该项研究将有力促进针对难成药/活性数据缺乏靶点药物发现的进展,同时证明了DEL+AI在难成药靶点/数据匮乏靶点领域的应用前景。
图2 所建立的LightGBM与MLP模型对测试集化合物的打分结果(~75%的高命中率)
新樾生物未来将持续推动该领域的技术进展,建立起化学结构-生物活性(亲和力或者功能)之间更广泛的联系,逐步提升新药开发的起点,从而缩短新药开发周期,提高新药开发的成功率,最终实现“以特色技术赋能新药开发,做百姓用得起的好药”的公司愿景。