娱乐化生活、web2.0时代,简单的搜索早已不能满足我们的需求,我们正急于迎接一场搜索理念的变革,一个全新搜索时代的到来。
·音频搜索新纪元
然而在简单搜索之外,还不仅仅是这种运用语音识别系统完成的搜索服务技术正在流行。当文字搜索已经发展到几乎没有上升空间的时候,微软、Google这些技术巨头也开始瞄准未来的新一代搜索市场。
文/本刊记者 黄婷婷
小琦在收音机里偶然听到一首动人的歌曲,但是主持人并没有报出这首歌的名字,于是他马上抄笔记下歌词,希望通过网络搜索获得这首歌的信息,在百度(www.baidu.com.cn)的歌词搜索里输入这句歌词后,他很快得到了想要的结果。
关于通过音频内容文字来搜索音频的概念,我们很快会联想到如小琦一样的搜索经验,似乎将音频与文字挂钩的技术早已不算是什么新鲜玩意,那么为什么日本产业技术综合研究所日前发布的一个音频搜索网站会得到业界如此广泛的关注呢?
不仅仅是歌曲
同样是小琦,这次当他想通过在节目里听到的字句来搜索一段相声的时候却出了问题,搜索答案五花八门,却找不到他想要的。
通常,我们使用最多的音频搜索都是针对于某一首歌曲的搜索,而它的歌词与歌曲的发布往往是同步的,整合这些数据并不需要多大的技术支持,因为这些内容都已经是现成的。然而除了歌曲,官方的一些朗诵、彩铃、评书、对白等作品,以及随着web2.0时代的到来,网络上涌现的大量草根族作品,如一段用录音笔随手录下的讲话、自我娱乐的博客音频等等,各种以声音为载体的信息也都通过网络这种渠道传播开来。如何在这样浩繁的数据库里查找所需的片断,成为困扰互联网搜索的难题。我们会通过其他的渠道如电视、广播等获得相关的信息,当我们被某一个信息吸引的时候,我们就有了获得它本身甚至更多边缘信息的需要。如果我们手里只掌握这个音频本身内容中的若干字句,没有它的名字、作者,乃至更多的信息,怎么搜到我们想要的?于是我们发现,寻常意义上的简单音频搜索已很难满足我们的需求了。
除了那些本身已有歌词文字可考的歌曲文件,更多的声音文件需要有一个后台将他们的内容转化为文字,方便用户的搜索操作。于是日本的这个名为Podcastle的网站经过多年探索,终于在6月上线,真正实现了通过内容文字进行音频搜索。这项服务采用声音识别技术,将声音数据全部自动转换成文字,收集到数据库中,使人们方便地进行音频检索。比如在网站搜索栏中输入日文“”,就能搜索到出现“”这个字的音频资料。
阅读小技巧:可以键盘左(<-)、右(->)方向键翻页

