首先要解释一下,“图像搜索”不是图片搜索,它和图片搜索是刚好相反的——即用图像搜索对应的文字,我认为这将会是下一项互联网搜索新技术。
在互联网日益发达的今天,搜索无处不在,对于我这样天天接触网络的人来说,离开了搜索,日子没法过——开发网站遇到技术性问题要搜索,做生意找货源要搜索,连出门看地图找公交也上网搜索。
看起来,现今的互联网搜索已经无所不能了,不过所有的搜索都有一个共同点:就是输入文字进行搜索,据我查找还没有发现点击“浏览..”然后从本地电脑里选择一个东东进行搜索的。
虽然现在要找资料找信息十分容易,但有时仍然会遇到一些不能直接找到结果的。比如你看到一个漂亮的字体但不知道它叫什么名,不可能直接找到答案,只能把这个字体的截图发到论坛或威客(比如百度知道)上去问,只能等网友人工回复。另比如你有一张挺熟悉却叫不出名字的明星图片、或者出游拍摄了一只鸟的照片想知道它叫什么,也只能发贴提问。
将来“图像搜索”就是为解决这种需求而诞生的。图像搜索的核心技术实质就是图像识别,严格说算不上什么新技术,但是要实现图像搜索,不仅要识别,还要能对比匹配,最后按相关度由高到低提供备选答案。当然,不能保证一定有答案。
技术可行性浅析:目前图像识别技术已经很成熟了,比如电脑上的OCR文字识别、手写输入,一台几百元的手机都有手写功能。在对比匹配技术方面目前也有一定基础,比如高级反黄软件能在一定程度上识别裸体,不过现在这个技术还不成熟,因为二进制图像的对比比文本难多了。
要实现图像搜索,必须先建立一个庞大的分类的数据库,人的鸟的树的花的要分开,这样才能保证搜索的效率和准确度。这个数据库可以采用开发词条+审核模式来建立,即由网友添加经管理员审核修正后入库。
由于图像不确定性太大,搜索时提示用户先对图像作处理,修改尺寸到适合大小、去掉周围的其它图像尽量保留纯色背景等,这样有利于提高查找成功率。
相比文字搜索,图像搜索的应用范围小得多,并且这个技术的需要性不是特别强,所以可能短时间内不会诞生,但它对日常工作生活和科研确实有一些作用,所以尽早有一天会出现的。
===================================
另外,我再预言一个:百度将会开发一个新产品——“题库”。百度现在的产品已经能排上一屏了,为我们提供了很多便利,“知道”就是一个不错的产品,它的实质是“威客”,只不过没涉及到正在的金钱交易。网页、知道、百科三个产品现在已经紧密相连了。现在的人都懒了,我经常在“知道”上看到有人问课本上的题目,甚至有贴上整个试卷提问的,奇怪的是居然还有人解答!也许不久后,他们再也不必提问等答案了,直接输入几个关键词,就能找到题目的标准或参考答案。
|