【学术安医】我校杨飞教授团队在医学数据挖掘研究方面取得新进展
10月21日,我校生物医学工程学院医疗大数据分析与转化实验室杨飞教授团队在医学数据挖掘方面的研究取得新进展。团队在国际学术期刊《计算新兴主题的IEEE汇刊(IEEE Transactions on Emerging Topics in Computing)》(中科院二区,IF=5.1)发表题为《基于长尾分布隐式图的自适应图结构估计(AGSEI: Adaptive Graph Structure Estimation with Long-Tail Distributed Implicit Graphs)》的学术论文,我校青年教师何云飞副教授为第一作者,杨飞为通讯作者,生物医学工程学院为第一作者单位。
近年来,图结构估计方法在构造隐式图推断图结构时,忽视了隐式图应与总体图结构保持一致分布,导致估计的图结构性能受限问题。为此,团队提出了一个基于长尾分布隐式图的自适应图结构估计方法“AGSEI”。
AGSEI主要包含长尾隐式图构造、显示图结构估计和联合优化三个模块。其中,长尾隐式图基于分位数构造与总体图结构同分布的多个隐式图样本,辅助后续图结构估计;显示图结构估计基于多个隐式图和原始图结构,利用贝叶斯推断和EM算法估计真实图结构;联合优化通过多次迭代优化长尾隐式图构造和显示图结构估计模块,使得估计的图结构逐渐接近真实图结构。该研究可为医学实体关联图网络中实体交互关系预测提供理论和技术支撑。
该团队10月以来研究成果丰富,在国际学术期刊《神经网络(Neural Networks)》(中科院一区TOP,IF=6)发表题为《学习个性化药物特征和区分药物对相互作用信息用于药物相互作用预测(Learning Personalized Drug Features and Differentiated Drug-pair Interaction Information for Drug-drug Interaction Prediction)》的学术论文,何云飞与研究生孟丽为论文共同第一作者,杨飞为通讯作者;在国际学术期刊《应用软计算(Applied Soft Computing)》(中科院一区TOP,IF=7.2),与南通大学丁卫平教授合作发表题为《基于信息瓶颈和对抗训练的鲁棒中文临床命名实体识别(Robust Chinese Clinical Named Entity Recognition with Information Bottleneck and Adversarial Training)》的学术论文,何云飞和研究生张志强为论文共同第一作者,杨飞和丁卫平为共同通讯作者,我校生物医学工程学院均为第一作者单位。
上述研究工作得到国家自然科学基金、安徽省自然科学基金、省教育厅重点项目的资助,以及安徽医科大学大数据分析超算中心算力支持。(生物医学工程学院)
论文1链接:https://ieeexplore.ieee.org/document/10726711
论文2链接:https://www.sciencedirect.com/science/article/pii/S0893608024007524
论文3链接:https://www.sciencedirect.com/science/article/abs/pii/S1568494624011839