赵慧民
博士,教授,博士生导师
1 成果名称及其发表的期刊:
Novel gumbel-softmax trick enabled concrete autoencoder with entropy constraints for unsupervised hyperspectral band selection. IEEE Transaction. Geoscience and Remote Sensing, 60(1-13), 2022.
(论文获取链接: https://ieeexplore.ieee.org/abstract/document/9447153)
高光谱图像技术广泛应用于农业、地质等应用领域,但由于大多数都应用场景都存在着数据获取难、精度低的问题,这也一直是制约着我国农业遥感应用技术的发展。其中,实现从缺少信息的情况下,准确对波段进行选择,将有助于推动我国农业遥感技术的应用,对我国加快解决农业问题有重要意义。
我院赵慧民教授、任金昌教授团队针对高光谱图像中波段选择问题,提出了一个基于Autoencoder方法的深度学习框架CAE-UBS,在信息标签缺乏的情况下依然能够对波段进行有效的分类,实现了面向高光谱图像的无监督波段选择学习系统。
CAE-UBS框架流程示意图
CAE-UBS框架是一个端到端的深度学习框架,首次在无监督波段选择领域应用了Gumbel-Softmax技术,实现了从连续的实数权重到包含0和1的二元权重的转变,在四个公开数据集上的实验表明,CAE-UBS比已有的方法表现更优秀,更稳定。该研究成果刊登于国际权威期刊IEEE Transactions on Geoscience and Remote Sensing(IF=8.125)。
2 成果名称及其发表的期刊:
SC2Net: A Novel Segmentation-Based Classifification Network for Detection of COVID-19 in Chest X-Ray Images. IEEE Journal of Biomedical and Health Informatics, Vol. 26, No. 8,4032-4043, August 2022.
(论文获取链接:https://ieeexplore.ieee.org/abstract/document/9782066/)
在全球新冠肺炎持续爆发的情况下,新的病毒变异株出现了潜伏期短、传播速度快、病毒载量高等特点,全面快速准确的检测,对我国及世界疫情防控都有着非常重大的意义。
我校计算机科学学院赵慧民教授团队与我校达之学者、英国罗伯特高登大学任金昌教授聚焦新冠肺炎胸部X-超像素图像分割处理及其AI空间域的智能计算研究,建立了Covid-19分类诊断网络SC2Net(Segmentation-based COVID-19 classification network),有效解决了新冠肺炎早期感染的精准诊断问题。
SC2Net流程示意图
SC2Net由肺部图像分割网络CLSeg和空间注意力网络SANet组成,通过在西班牙COVIDGR 1.0(Hospital Universitario Clínico San Cecilio, Granada,Spain)数据库实验表明,SC2Net平均诊断率超过84.23%,比现诊断使用的FuCiT-Net和COVID-SDNet方法准确率提高了3%-4.8%。相关研究成果发表在权威期刊IEEE Journal of Biomedical and Health Informatics(IF=7.021)。
目前,该团队积极与广州医科大学附属医院合作,有望通过临床应用进一步提高诊断效果。
Jinchang Ren(任金昌)
博士,教授,博士生导师
1 成果名称及其发表的期刊:A Novel Intelligent Computational Approach to Model Epidemiological Trends and Assess the Impact of Non-Pharmacological Interventions for COVID-19. IEEE Journal of Biomedical and Health Informatics, vol. 24, no. 12, pp. 3551-3563, Dec. 2020, doi: 10.1109/JBHI.2020.3027987.
(论文获取链接: https://ieeexplore.ieee.org/document/9210178)
当今新冠病毒依然在肆虐全球,各地新冠病毒偶尔爆发,理解其流行病学趋势和非药物干预的影响,有助于疫情传播的预测,为我国疫情动态清零提供技术支持,对我国乃至全球疫情防控有重大的积极意义。
我院赵慧民教授、任金昌教授团队提出了一种新的智能计算模型SSA-GF,用于预测新冠肺炎的流行病学趋势,并且评估非药物干预的影响。
SSA-GF模型流程示意图
SSA-GF模型首先使用奇异谱分析(SSA)技术提取潜在的大流行趋势,将NDCC时间序列分解为少量独立和可解释的成分,如缓慢变化的趋势、振荡成分和无结构噪声。然后,该模型使用混合高斯拟合(GF)推导出SSA提取的每日确诊病例数趋势的新预测模型。在已有的中国和韩国数据集上的实验表明,SSA-GF模型能够准确预测每日确诊病例趋势、每日高峰病例、大流行期长度、总确诊病例以及累积确诊病例曲线上转折点的相关日期。此外,该方法通过模型参数对非药物干预影响进行可解释评估,为政府执行社区封锁和出行限制政策提供数据上的支撑。该研究成果刊登于国际权威期刊IEEE Journal of Biomedical and Health Informatics(IF=7.021)。
2 成果名称及其发表的期刊:
SpaSSA: Superpixelwise adaptive SSA for unsupervised spatial-spectral feature extraction in hyperspectral image. IEEE Transactions on Cybernetics, 52(7): 6158-6169, 2022.
(论文获取链接: https://ieeexplore.ieee.org/document/9533174)
由于高光谱技术具有波段多、光谱范围窄、波段连续、信息量大等特点,高光谱检测技术广泛应用于农业等应用领域。提高高光谱检测准确率有助于大范围农情分析,对我国加快解决农业问题有重要意义。
我院赵慧民教授、任金昌教授团队提出了一种新型的高光谱图像特征提取方法SpaSSA(Superpixelwise adaptive Singular Spectral Analysis),利用超像素自适应的奇异谱分析方法,有效提取高光谱图像的局部特征。
SpaSSA方法流程示意图
SpaSSA方法结合了传统SSA方法和二维SSA方法,根据每个波段提取的超像素区域的大小,自适应地选取两个方法来提取特征。不同于已有提取全局特征的方法,SpaSSA提取高光谱图像局部特征,能够更有效地描述高光谱图像中的对象,同时极大地降低计算成本,提高特征提取计算效率。该研究成果刊登于中科院一区期刊IEEE Transactions on Cybernetics(IF=19.118)。
3 成果名称及其发表的期刊:
EACOFT: An energy-aware correlation filter for visual tracking, Pattern Recognition, Volume 112, 2021, 107766, ISSN 0031-3203.
(论文获取链接:https://doi.org/10.1016/j.patcog.2020.107766.)
作为计算机视觉中的一个重要研究方向,视觉追踪有着广泛的应用,例如智能驾驶、人机交互、视频监控等。近年来,基于相关滤波器的跟踪方法因为其在频域计算特性,可以以相对较快的速度有效地定位目标,所以得到广泛的关注。但是,这一特征也限制了其在某些特定场景中的通用性。第一,当跟踪能量低于背景的物体时,跟踪器可能会发生漂移甚至丢失目标。第二,不可避免地会选择有偏差的样本进行模型训练,这很容易导致跟踪不准确。因此,基于相关滤波器的跟踪方法依然无法超越已有最先进的视觉追踪方法。
为解决这些问题,我院赵慧民教授、任金昌教授团队提出了一种基于能量感知相关滤波器的跟踪方法(EACOFT,energy-aware correlation filter based tracking),自适应地平衡前景和背景之间的能量,使感兴趣的目标始终具有高于背景的能量,有效地在后续帧中跟踪目标。此外,该团队还提出了一种自顶向下与自底向上相结合的模板训练策略,大大增强了追踪方法的有效性和鲁棒性。在公开数据集OTB100上的实验表明,与多个最先进的跟踪方法相比,EACOFT具有更优秀的表现。该相关研究成果刊登于中科院一区期刊Pattern Recognition(IF=8.518)。
EACOFT与传统基于相关滤波器追踪方法比较示意图
李春英
博士,副教授,硕士生导师
成果名称及其发表的期刊:Motif-based embedding label propagation algorithm for community detection. International Journal of Intelligent systems. 2022; 37: 1880- 1902.
(论文获取链接:https://onlinelibrary.wiley.com/doi/abs/10.1002/int.22759)
复杂网络已成为计算机、物理、数学、生物、社会学及复杂性科学等多学科的研究热点,社区结构(Community structure)是复杂网络所拥有的一个最普遍和最重要的拓扑属性,如在社交网络、引文网络、生物化学网络或者电子电路网络中。社区检测是利用复杂网络的拓扑结构以及节点的信息发现复杂网络中的密集连接子网络或者属性相似度更高的节点集合,揭示复杂网络的聚集行为进而更好地理解和开发这些网络,对复杂网络结构分析、功能演化及预测具有重要的理论意义和实际应用价值。
我院李春英副教授团队提出一种基于模体嵌入的标签传播社区检测算法(MELPA,Motif-based embedding label propagation algorithm),该算法利用模体挖掘网络的高阶特性,构造复杂网络超图,为避免超图中出现孤立点,充分利用网络的低阶连接特征,重新优化复杂网络拓扑结构。基于重新优化的复杂网络拓扑结构,该团队还提出了一种新的标签传播策略,解决了算法中标签传播选择的随机性缺陷,从而识别出更稳定的社区结构。在人工合成网络和真实复杂网络上的大量实验表明该算法具有较好的检测效果,尤其是对于社区结构不明显的复杂网络,MELPA算法会取得意想不到的效果。
该研究成果刊登于中科院一区期刊International Journal of Intelligent systems(IF=8.993)。
MELPA算法流程示意图
黄华盛
博士,副教授,硕士生导师
成果名称及其发表的期刊:Deep color calibration for UAV imagery in crop monitoring using semantic style transfer with local to global attention. International Journal of Applied Earth Observation and Geoinformation. 104 (2021): 102590.
(论文获取链接:https://www.sciencedirect.com/science/article/pii/S030324342100297X)
随着人工智能的发展,基于无人机影像的监控技术在农业上的应用也得到快速发展,尤其在超大范围农作物监控,提高影像识别能力以及识别鲁棒性将有效增强我国农情监测技术水平,对我国智慧农业的发展有着巨大的积极意义。
由于无人机飞行的过程中,温度和照度的变化往往会造成影像的偏色,不可避免对作物胁迫、养分和产量的评估造成误导。针对色彩校正这一关键问题,我院副教授黄华盛团队提出了一种单编码器-多解码器网络架构,利用语义分割和风格迁移的协同,实现端对端的颜色迁移。此外,该团队还引入面向作物的自适应实例归一化(AdaIN)方法来估计作物区域的偏色,并提出一种局部到全局的注意力机制以实现整个图像区域的精确颜色校正。实验结果表明,该方法在所有指标上都领先或接近于同类算法,其中在KL散度上获得了3.9个百分点的提升。该相关研究成果刊登于中科院一区期刊International Journal of Applied Earth Observation and Geoinformation(IF=7.672)。
框架示意图
黄华盛副教授团队提出的方法有望为农情监测建立一个颜色校正的通用框架,从而为后续的数据解译垫定良好的基础。
李辉辉
博士,副教授,硕士生导师
1 成果名称及其发表的期刊:Augmenting features by relative transformation for small data. Knowledge-Based Systems. 225 (2021): 107121.
(论文获取链接:https://doi.org/10.1016/j.knosys.2021.107121)
近年来,以深度学习为代表的人工智能技术已经应用到各个行业,驱动人工智能技术蓬勃发展的是各行各业积累的大数据,但在很多应用领域,数据都是难以获取的,数据样本不足严重影响深度学习模型的性能。如何在小数据的情况下,仍然能够保证机器学习的性能是提高人工智能技术应用的重要问题。
我院副教授李辉辉团队针对小数据问题,对人类认知相对论进行形式化建模,提出了一种基于相对变换的特征增强方法FART(feature augmentation method based on the relative transformation)。该方法将相对变换后的特征作为增强特征,然后通过神经网络为每个样本自动学习这类特征。FART方法仅利用小数据的信息和人类认知规律,不再需要任何额外的信息,就可以应用于任何具有特征的数据,具有普适性。该研究成果发表在中科院一区期刊Knowledge-Based Systems(IF=8.139)。
FART框架示意图
2成果名称及其发表的期刊:Self-labeling with feature transfer for speech emotion recognition.” Knowledge-Based Systems. 254 (2022): 109589.
(论文获取链接:https://doi.org/10.1016/j.knosys.2022.109589)
语音情感识别是人机交互的核心技术,广泛应用于呼叫中心、社交机器人、医疗保健、智能家居和客户服务等领域。目前基于帧的语音情绪识别方法将每个语音样本分割成更小的帧,这些帧被标记为与语音样本相同的情感标签,这种方法与语音样本同时包含多个情感类别的可能性是不一致的。
我院副教授李辉辉团队提出了一种语音情绪识别的自标签学习方法,该学习方法将每个语音样本分割成帧,自动用不同的情绪标签对其进行标记,并检查所有标记标签的相容性。然后,利用标记的语音帧作为训练数据,融合语音情感识别的领域知识,设计并训练了一种用于语音情感识别的时频深度神经网络(TFCNN)。由于大多数语音情绪数据集非常小,在大规模音频数据上进行训练,将其特征迁移到时频深度神经网络(TFCNN)中进一步提高性能。在现有语音情感数据集上的实验结果证明了该方法的有效性。
该研究成果刊登在中科院一区期刊Knowledge-Based Systems(IF=8.139)。
方法框架图
韩娜
博士,讲师,硕士生导师
成果名称及其发表的期刊:Average Approximate Hashing-Based Double Projections Learning for Cross-Modal Retrieval. IEEE Transactions on Cybernetics.
(论文获取链接:https://doi.org/10.1109/TCYB.2021.3081615)
随着自媒体时代发展,图像,文本,视频等多模态数据爆炸式增长,如何做到类似人脑地对这些不同形式的信息进行语义的对齐与互补,是跨模态人工智能的目标,同时也是实现强人工智能的一个关键研究问题。其中,跨模态检索就是跨模态人工智能最基础的任务,它以一种类型的数据作为查询去检索另一种类型的数据。
我院韩娜博士团队提出了一种基于平均近似哈希(AHH,Average Approximate Hashing)的跨模态检索方法,利用标签信息将局部性和残差保持集成到图嵌入框架中,同时将不同形式的数据投影到不同的语义空间中,然后使这两个空间彼此接近,从获得统一的哈希编码,在图嵌入框架中引入类似主成分分析方法的投影矩阵,确保了投影数据能够保留数据的主要能量。在多模态检索标准数据库上的实验表明,AAH方法在平均精度均值(mAP)图像检索文本上提升了2%,在文本检索图像上提升了5%,在精确率-召回率(PR)指标上也优于当前几种最先进的交叉模式哈希方法。
AAH框架示意图
AAH方法解决了当跨模态数据被投影到一个公共语义空间带来的能量损失的问题,拉近了因为不同模态信息间因形式不同造成的异构鸿沟。该研究成果刊登于中科院一区期刊IEEE Transactions on Cybernetics(IF=19.118)。
张越
博士,副教授,硕士生导师
成果名称及其发表的期刊:Deep Multiview Clustering via Iteratively Self-Supervised Universal and Specific Space Learning. in IEEE Transactions on Cybernetics.
(论文获取链接:https://doi.org/10.1109/TCYB.2021.3086153)
在信息爆炸的时代中,人类获取信息的形式来源丰富多样,数据可能来自不同领域的不同来源,或者来自不同的特征收集器,例如不同机构报道的新闻、相同语义的多语言形式表示等。多视图聚类的目标就是根据数据不同来源的信息,将其划分为不同簇,是无监督学习中的一个重要任务。
我院张越副教授团队利用交叉视图关系提供多源目标的全面描述,提出了一个线性多视图子空间聚类模型L-MSC,为每个视图学习公共和特定的线性子空间,充分利用它们的协作表示。公共空间对应于所有视图的通用自表示,而特定空间对应于视图特定表示。同时利用利用深度非线性的实现特征,该团队基于L-MSC提出了一个深度模型(D-MSC),建立准确的亲和力矩阵,实现端到端结构联合优化了特征学习和数据自我表达。在模拟和真实数据的充分实验证明该模型比基准模型更具优势。例如,以ORL数据集实验为例,D-MSC在准确率(ACC)、归一化信息熵(NMT)和调整兰德系数(ARI)方面分别提高了3.59%、2.48%和5.51%。相关研究成果发表在中科院一区期刊IEEE Transactions on Cybernetics(IF=19.118)。
D-MSC模型示意图