一分鍾了解以圖搜圖
2018.06.05
图像检索技术作为網站建設服務中的一个重要应用,历来都是人们非常重视的部分。
最初圖像搜索技术主要基于数据库检索,简单说就是
「1」建立圖像數據庫
「2」 给每张图打标签
「3」 检索
由于是基于數據庫的檢索,也就只能采用技術數據庫的優化手段,當數據量很大,或者標簽量很大時,系統性能會受到很大影響。
然后就开始导入搜索引擎,基本上解决了据量很大,或者标签量很大时带来的系统性能的问题。但是,在实际的应用当中,人们会发现,其实标签也有不靠谱的时候。原因是数据量很庞大的时候,很难有一个很完善的标注、审核校对的机制,确保标签是充分的,准确的。即便排除人为因素,其实有很多场景下,很多图片是很难用文字去描述的。这就给我們带来一个新的课题,如何基于图片的内容去检索?
基于内容的视觉信息检索技术 content-based visual information retrieval CVIR基本上解决了我們所困扰的问题,或者至少说正在解决这些问题。这也就是我們常说的以图搜图,是通过搜索图像文本或者视觉特征,为用户提供互聯網上相关图形图像资料检索服務的专业搜索引擎系统,是搜索引擎的一种细分,即通过上传与搜索结果相似的图片或图片URL进行搜索。
簡單來說以圖搜圖分爲以下幾步
「1」提取目标图片的特征值,简单来说特征值就是利用图像的颜色、形状、纹理、轮廓、对象的空间关系等基本视觉特征建立的一组数据。描述图像特征值的算法有很多:包括直方图法,累计直方图法,局部直方图法等等等等,用的比较多的是:SIFT描述子,指纹算法函数,bundling features算法,hash function(散列函数)等。
「2」將圖像特征值進行編碼,基于圖像特征值建立海量圖像數據庫及搜索引擎。對于目標圖像,可以對分辨率較大的圖像進行降采樣後在進行圖像特征提取。
「3」相似度匹配运算:利用目标图像的编码值,在圖像搜索引擎中的图像数据库进行全局或是局部的相似度计算;筛选最佳匹配图片。