易动商务 --> 杂志 --> 互联网周刊 --> 商业

本站导读

图片搜索可以变得更智能吗?微软亚洲研究院的研究员张磊博士为《互联网周刊》带来了肯定的答案。

·能识图的搜索

让计算机能像人类一样“看”到一幅图片的兴趣中心?这并非不可能。

互联网周刊 | 本刊记者 李洋 | 2007年07月20日 第 14 期刊载
2007年09月12日 星期三 本站发布

 

    让计算机能像人类一样“看”到一幅图片的兴趣中心?这并非不可能。

在一些专业图片公司里,很多员工每日做着简单而枯燥的工作,对各种图片进行归类、标注,撰写描述信息。计算机何时才能够像人类一样看懂一幅图片?

市场现状是,搜索引擎能够认字,却无法识图。无论是基于桌面的图片管理软件还是基于互联网的图片搜索,都还停留在一个浅显的层次,主要依靠图片本身的文件名称和简介来获取一幅图片的含义。给搜索引擎一张图片,它很难像搜索关键字那样,搜索出与之相关的图片。

图片搜索可以变得更智能吗?微软亚洲研究院的研究员张磊博士为《互联网周刊》带来了肯定的答案。

新一代图片搜索技术已经可以像人一样,“看”到一幅图片的兴趣中心,判别它是人物肖像照或是风景照、摄于室内还是户外。甚至,在人的协助下,计算机还能够在许多张合影中找寻到同一张人脸。这些听起来不可思议的事情,已经在微软的实验室里变成了现实,甚至有些技术已应用到部分产品当中。

通常,用数码相机拍摄的照片都带有时间戳,因此当系统将其按照时间分组时,较为容易实现。在时间轴上,各张照片的时间戳分布是不均匀的,而根据其时间间隔密度,系统便可以把一段时间内拍摄的照片自动分组。这样用户可以很容易按照时间意义上的事件来选出需要的照片。

而在按照室内/室外、城市/风景进行分组时,实现起来则稍有难度。系统通过对图像的颜色、纹理进行辨别。通常来说,室内的色调偏暖,背景均匀,纹理变化不大,室外则相反。在处理城市建筑/风景图片时,分析方法也与之类似。系统将图片划分为5*5个子图,对每个子图提取相应的颜色矩信息,并分析其纹理的边缘方向是垂直还是水平。

123下一页尾页

阅读小技巧:可以键盘左(<-)、右(->)方向键翻页