首页 > 问答 > 开发一个自动过滤垃圾流量工具,源码应该卖多少钱?

开发一个自动过滤垃圾流量工具,源码应该卖多少钱?

[导读]:上个月的发生的不开心的事情自我反省后,觉得问题还是出在自身,今后要么不开发,要么就做出其他人模仿不了的东西,抄袭不了才是 真·技术 。 以自己的工具每日足够多的...

上个月的发生的不开心的事情自我反省后,觉得问题还是出在自身,今后要么不开发,要么就做出其他人模仿不了的东西,抄袭不了才是真·技术
以自己的工具每日足够多的垃圾流量作为样本,萌生了自动过滤擦边内容的想法。
然后通过书籍,搜索引擎找到最简单靠谱的办法是贝叶斯规则过滤。



Facebook出人意料的决定拿掉这个关键的项目。Atlas广告技术主管Dave Jakubowski在Atlas官方博客发文,表示将不再进行全面全平台DSP竞价产品的研发,转而将更多注意力放在更有前景的原生、视频、和移动上。

1、Facebook的DSP产品碰到了数量惊人的劣质广告和虚假的机器人流量。尽管他们做了筛选,但依然被无价值流量的规模所震惊。

2、通过对广告形式进行调查,他们发现真正具有展示价值的广告形式只有:原生和视频。

###

真正的实时过滤,那就必须得人工智能了,然而,百年内无望~,这是大势所趋,技术积累不够,达不到出现真正人工智能的科技基础累积的质变

###

不知道这个的市场需求量是多大

###

测试过几个项目再说出售吧。

###

$seg是搜索引擎进来的词?
$spw是擦边词库?$spw[$i][0]是擦边词,$spw[$i][1]是正常类的概率,$spw[$i][2]是垃圾类的概率?
$spp[$i]是搜索词通过的概率,$spo[$i]是屏蔽的概率?
搜索两个词以上的就是is_array?

“1. 收集擦边词库(已完成)”。黑名单制,你确定黑名单是全的?
第2、3、4,你怎么区分是垃圾文本还是正常文本?

就你放出来的代码看,只是进行了单个字的分析,也许你后期会把擦边词库里的词进行组合再分析。然而,中文博大精深,同样的词就有不同的理解,你怎么不识别语意进行区分?

举例
做爱做的
做爱做爱

我喜欢上她了
我喜欢上她了

###

市场需要开发,让一批用户免费使用,后在付费!让这些第一批种子给你更多的建议!让他们帮你推广传播种子!

###

1、星爷已久很牛
2、我喜欢那个词库
3、站长应该用不到,建议卖给IDC

###

表示不懂,

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/43185.html