如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
自动图像标注算法研究吴效莹李士勇(河南科技学院,河南新乡453003)[摘要]首先介绍AIA(AutomaticImageAnnotation)在计算机视觉技术中的应用及其定义,其次对AIA方法进行了研究论述,着重论述了CMRM、CRM、MBRM等主要的图像标注方法;最后探讨方法的局限性。[关键词]AIA;CMRM;CRM;MBRM;CLP;WordNet随着Internet的普及,信息资源急剧丰富,如何从海量的数据信w其中,是单词在质心的总数量,即,表示所息中处理、分类图片,以供人们找到有价值的图像信息已越来越迫切,mjiwicjMjΣmjkk=1自动图像标注应运而生。自动图像标注也被称为图像的自动注释,目的有单词在质心的总数量,n表示单词在所有数据中的总数量,N是找到低级的视觉特征和高层语义的相关性,实现对图片分类。自动标cjicj注图像技术涉及机器学习,图像处理,人工智能和信息检索等方面的内w即表示对于所有数据,包含每个单词在每次出现时重复计数的整容,具有很强的研究价值和商业应用价值例如对互联网上图像的分析Σnk。k=1并标注,实现图像广告的投放,既用户在点击风景图片后,可自动标注个单词数量。与图片信息相似的旅游地的旅行社广告供用户参考;也可用于知识产权(二)机器翻译模型保护,检查新商标是否与原有商标图案过分相似;也可对海量数据库图Duygulu等改进了共现方法,采用机器翻译模型,适用于把单词片进行分类检索;医学图像分析处理等。翻译成称为块的图像区域。标注算法首先建立训练图片集,每张图片进自动图像标注的主要挑战是要建立一个模型能够分配视觉术语,行图像分割,提取全局特征后聚类,每个类具有相同的图片特征,成为成功地描述图像大多数算法的出发点是一个训练集图片,它们已经用。视觉词,对个各类进行编码,建立视觉词码表。然后通过最大似然方法简单的特征关键词标注过,用非结构化的文本数据,描述图片的内容;估计文本与视觉词的后验概率,建立文本与视觉词的联系。对未标注图接下来的步骤是应用图像分析技术从一个未见过的图像提取相同的特征像,提取视词,比对同视词先前计算好的后验概率,取较大概率值对应信息图像分析技术是用于提取图像特征的,如颜色,质地和形状,以。的前几个文本做标注结果,从而完成对图片的标注。公式为:模拟图像特征条件的分布特征的获得可从整体图片,全局性获得;也。nMnLn可从块,分割图片为不规则部分;或从片,矩形的分割图象;然后比较()()()Pw|b=仪仪Σpaxj=itw=wnj|b=bni所有以前创建的模型中的每个关键字,产生当前待标注图像里每个关键n=1j=1i=1其中N表示图像数量,M表示在第n张图片中出现的单词数量,字的概率值,最终确定标注结果。n表示第张图片中视觉词元的数量()表示在图片中给定另一些算法采用一个1或0组成的阵列产生最后输出,阵列长度Lnn。paxj=in视觉词元与给定单词的赋值概率,而()表示给定与词汇表中单词数相同,指示当前图像中的对象术语是否存在,据此产biwjtw=wnj|b=bni视觉词元b的情况下,出现单词w的条件概率根据p(w|b)可知单生一个概率评价,对每个概念是否在图像内提供一个信度。。其他自动图像标注体制执行另一个算法,假定每个标注是一个固词与视觉词元之间的联合概率,然后据此对图像进行标注。(三)概率潜在语义分析定的长度。举例来说,如果标注的长度是K,则选长度为K具有最大概Monay和Gatica-Perez介绍了隐变量链接图像特征单词捕捉共率值的单词为标注。另一种方式是确定一个阈值,所有概率高于阈值的现信息的方法方法基于潜在语义分析(LSA),LSA来自自然语言处关键字被视为标注。。最后是独立于方法来确定标注,用图片自动标注系统生成一组关理和分析图像和图像注释术语间的关系。增加了一个概率模型的LSA导致发展出概率潜在语义分析(PLSA)有人提出利用隐变量分析对键字集,帮助理解图像描绘的场景。。图像进行索引,首先用文本标注与blob直方图矢量的拼合表示图像,一、自动图像标注算法然后对混合矢量用pLSA分析,得到相应概率模型对新图像标注时,自动标注算法很多,基于如下方向:共现模型、相关模型,生成。将对应文本标注信息的图像特征矢量置为0,得到对应隐变量的条件概式模型,传播式模型,词汇间关系等。常用算法有如下几种:(一)共现模型率,据此再推断各个词汇的标注概率。(四)跨媒体相关模型最早使用共现信息的是Mori等人,他们分划每个培训的图像为(,跨媒体相关模型)算3x3到7x7相等矩形部分为开始,然后提取所有部分的特征,每一部分CMRMCrossMediaRelevanc