今天删了三次,几乎每隔一定时间都会有垃圾引用,每次删除的数量平均再150吧,也就是说,不到一天的时间,差不多1000条的不该有的东西了。看来,被贼盯上了。
所以,无论做什么都要坚持一个原则:害人之心不可有,防人之心不可无哇。防止小人的破坏是首先想到的。其实,这些发垃圾留言的也可以理解,因为在大部分搜索引擎的算法里,链接占很重要的地位的,(看看信息产业部的PR就知道了)所以,他们追求大量的链接。但是,如此手段在以前是可行的,但现在,已完全没作用了;甚至,还有反作用。比如Google,会根据链接到网站的文字信息来判断是否有作弊嫌疑,一旦视为作弊,那么你的网站就被打入十八层地域了,以后翻身久艰难了。
一般的站点不会有如此傻的做法的,一般是自称做SEO收了别人钱才这么做的,因为他们追求的就是短期内的大量链接,要不然用户好像看不到效果嘛。当然,如此繁重的工作也不会由人工完成,而是专门写的程序。
看看如此程序是如何工作的:
1.首先他们的程序自动在GooGle上搜索“Z-Blog”或“bo-blog”,然后自动分析前几百页的搜索结果(前几百页是PR高的,只有PR高的发spam才有用)。把地址不同的,列成一个博客地址表。一般得到的结果有一部分是这些含有评论输入框blog页面,也有一部分不是,只要简单判断一下url规则,就知道哪些是含有输入框的博客页面了。
2.如果该博客支持XML-RPC,比如Z-BLOG,PJBLOG。那么程序就直接分析出这个页面评论的XML-RPC-COMMENT-POST地址,然后POST发送一段含有广告代码UBB的评论内容就可以了。超简单。如果不支持,没关系,请看步骤3。
3.程序模拟浏览器方式多线程多窗口自动分析每一个URL中是否有输入框,是否有验证码,如果有验证码,则自动调用验证码识别程序dll。这个验证码识别程序dll能买到,很好买,像Z-Blog,pjblog,oblog这种简单的验证码,200元以内就能搞定,动网那种复杂的验证码识别dll稍微加点钱也能搞定。现在他们搞不定的是腾讯那种汉字的验证码。这个最高效。 程序把事先编辑好的文字填充进入不同功能的输入框,然后自动模拟js提交就可以了。
避免垃圾留言:
1.只有注册用户才能留言。
对于一般Blog这样做似乎不好,因为大部分访问者都是随机性的,他们可能看一两篇文章就走人了,从此可能再也不会来了,随意他们不会花时间注册;况且,加入注册的话,小小的Blog里存放一些用户的信息没必要吧?
2.每次留言处随机生成验证码
这个办法还是不错地。不过有些机器可以对简单的验证码分析的出来,可以弄的复杂一些,只要别复杂到肉眼看起来都分辨不出来就可以了。
3.过滤一些特殊的词组
这个原理和很多常见软件差不多吧。与GFW差不多吧? :) 防止小孩子看不该看的网站的监控软件和这个原理上也应该一样。因为垃圾留言是冲着链接来的,他们的留言里肯定有 href 或者 [url] 这样的字符串。
4.根据发言的ip记录判断是否有Spam,把短时间内发大量信息的ip或者发的信息内容相同的ip屏蔽起来
这个多的只是每次增加留言时查询一下数据库里以前的数据,并进行比较,可以考虑。
本Blog修改:tb.php文件
ziyun
2007/07/06 16:42
偶没办法,只好删除引用了。
分页: 1/1
[1]
[1]

2006/11/21 22:09 | by Sangern ]
关于:感情,熊猫,黄河
关于:阿基米德,尤里卡



