图像挖掘渐渐成为人们关注的焦点。这项技术可以广泛地应用于图像分类和检索、医学影像诊断、卫星图片分析、地下矿藏预测等领域。跟传统的图像处理和图像理解技术不同,图像挖掘的重点是从一个大的图像集中提取有价值的信息。目前国内外对于图像挖掘的研究还不是十分成熟,很多理论上的问题还有待进一步发展。其中一个重要问题就是如何对图像数据进行紧致性分析并将之应用在图像聚类和图像分析中。我们观察这个世界,将各种场景进行归类、分析,在这个过程中数据紧致性起着非常重要的作用。世上的物体千变万化,但它们的外貌都有相对稳定、相对紧凑的模式,这其中就包含了数据紧致性。
本项目将面向图像挖掘的应用问题,针对图像数据所具有的高维、大量、非线性特征,对图像数据的类紧致性和界紧致性进行理论探讨,并研究在具体的图像挖掘应用中所需的特定技术,以期能够提升现有的图像挖掘系统的性能。更具体的,图像挖掘可进一步分解为图像预处理、特征抽取、分类/聚类、神经网络和关联规则挖掘等子问题。本项目的主要研究内容将集中在如何利用数据紧致性来完成以下功能:
(1)对图像数据进行有效的聚类;
(2)计算图像模式类在特征空间中的形状和结构;
(3) 结合流形学习以提升图像挖掘系统的检索性能。

图 1 总体研究框架及各项研究点之间的关系。

图 2 (左图)点对流形的距离,(右图) 流形对流形的距离