首页 > 问答 > 关于百度分词技术

关于百度分词技术

[导读]:关于百度分词技术 想请教个问题 中国棉纱线网 是不是可以分成 棉纱 纱线 纱线网 中国纱线网 中国棉纱 中国棉纱网等 期待您的答复 谢谢 搜索了一下,楼上的分词应该是谷歌的...

关于百度分词技术 想请教个问题 中国棉纱线网 是不是可以分成 棉纱 纱线 纱线网 中国纱线网 中国棉纱 中国棉纱网等 期待您的答复 谢谢

搜索了一下,楼上的分词应该是谷歌的分词技术,百度是分成了中国、棉纱、线网。每个搜索引擎分词技术有所区别吧。

###

我个人理解啊,分词是分成最小的单元,然后去除掉噪声词,根据语义进行不同词的权值的匹配。最后就是进行索引的时候,进行不同的匹配展示。

你的这种就不是分词,我觉得更多的是匹配。如果是分词的话,应该是中国 、棉纱线、 网(这个属于语义最小化,其它两种分法,不列举了),你的更像是要把分词后的最小单元按照搜索词进行匹配。这种匹配那就是模糊了,你可以随意匹配,但是不同组合代表的权值是不一样的

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/86620.html