现在的搜索引擎网站是否会识别图片的文字?这个问题看起来肯定很好笑。但是目前图片识别技术貌似越来越高级了,不像以前那个时候了。一方面,我个人还真不知道现在的搜索引擎是否已经高级到可以识别图片里面的内容和甚至一些文字内容。另外一方面,搜索引擎的图片搜索排列里面他们到底是怎么把一些反政治以及色情之类的信息过滤掉的呢,不知道?
事情还是有起因的。前几天在一个论坛里面回帖,帖子里面貌似可以使用搜搜的那个表情,可以搜索出很多动态的图片表情。如果找到一个里面有个文字的图片,文字比较搞笑。回帖回复不了,里面提示说含有敏感文字。检查文字没问题后再回一样的。后来发现是图片上面的文字。图片的文字论坛是怎么识别出来的呢?换了张图片完好回复。
于是今天我就上来问问这个问题,和大家一起讨论讨论,搜索引擎网站是否已经进化得能识别图片里面的文字了。
站在程序的角度上讲,搜索引擎如果要识别程序,势必要付出多出很多倍的计算成本的代价,这个是百度高层要考虑的,普通文本的计算和识别图片的计算,差很多,批量起来,计算成本更是非常的高。
然后站在蜘蛛的角度上讲,一个页面里面的图片收或者是不收,不用识别图片,通过分析这个页面的一些文字信息,所获得的结果也可以达成一定的目的。
最后,我觉得识别图片是早晚的事情,只不过现在还有点早
可以的
学习
###图片本身的内容暂时无法识别。
要想识别图片,以图片周围的文字和alt下手。
如果百度可以识别出来,软文带上图片宣传推广的手法可能也没断掉
###搜索引擎有技术来识别图片中的文字,但是目前可能因为成本高,而没有应用在实际中。
###搜索引擎现在对于图片文字的识别也只是一星半点,还不能完全的识别,更多的识别是图片的alt、加上图片周围的文字结合ALT标签、网站文章的标题、以及图片周围最近的一个标题,来识别文字的内容的。
比如一个没有ALT或是任何信息的图片,百度对于图片的识别是从这个图片上方的最近一段话,以及图片下方的最近一段话中,寻找最有可能的关键词来对图片进行关键词的匹配的。你可以去百度搜索某个关键词的图片,基本中有很多都是没有任何标签的图片。
百度识别图片的内容,并非是从图片中的内容入手的,百度的技术还没有这么先进。
现在应该还不能吧,只能读取图片 title 文字描述或图片文件名。
不过好像Evernote有技术搜索图片中的英语信息。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/84069.html