刚跟网友上帝使者聊天时说到防采集,我们能采集别人的信息,就同样会面临被别人采集,
如何有效的防止被采集,这个问题难度不小,但是从采集规则来看防采集,就有了一系列的想法~~
比如 : 列表页的随机模板调用生成,内容页的随机模板调用生成....
也只是这样说,但是具体还没什么想法,希望潜水中的高手们可以一起出来讨论这个问题~~~
将对一些好的想法给予一定的奖励~~
活跃起来,风讯的论坛是用来交流的,不是潜水的~~~ 请各舒己见!
[此贴子已经被作者于2006-9-4 14:31:02编辑过]
先顶一下
希望各位大虾都说说自己的方法让我们学习学习啊
有一个方法:
在标题后加上(页码)
比如:标题为 中华人民共和国 共3页
生成:中华人民共和国(1) HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(1)</b></span>
中华人民共和国(2)HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(2)</b></span>
中华人民共和国(3)HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(3)</b></span>
哪位老大讲解一下,能解吗??首先声明 :经测试 这样的写法不行:
<span style="font-size:12pt"><b>[标题]([变量])</b></span>
<span style="font-size:12pt"><b>[标题](1)</b></span>
------------------------------------------------------- 小竣 回复 ----
之前 chning 大斑竹跟我说这样的也可采,因为他始终是有共通性的,比如 [标题]([变量]) 这样~~ 我技能不高,没解决,现在已经都可以破掉这个了~~
pcgame.com.cn的新闻难采
主要是新闻标题
无论是title
还是新闻的主标题都是变化的..真郁闷
pcgame.com.cn可以采的
foosun的采集我没用过,用dede和nc的采集都可以采到,powereasy的也可以的
pcgame.com.cn
可以采,他也就两个头,两上内容而已,我都采了
要本着互联网共享的精神,如果大小门户网站,专业类网站都设成防采集了,那我们这些小网站还用生存吗?现在做网站只是一种乐趣,一种爱好!
简单来说防采也就两种方法:(以下属于个人看法,如有雷同,纯属巧合)
一种是硬防(也就是从服务器下手)示例www.ddvip.net 另一种是软防(也就是从程序下手)示例 tech.163.com/school 他生成很多不规则的标识,让你无从下手!栏目页生成几种不同标识,新闻页也有N种分页方式,N种内容、标题等等不一样的标识!
有什么奖励啊!
[此贴子已经被作者于2006-3-23 14:18:21编辑过]
恩 是个问题
我的服务器总是被人采死,CPU长时间100%
------------------------------------------------------------小竣 回复 -----------
现在已经有了防采集的方法,不过可能影响搜索引擎的收录~ 就是文章内容页用<script src=**.asp?id=****></script>这样来显示内容~~ 采集到的也就是这个 js而已 他本地无,信息又采不到~ 他如果在 **.asp前加你站的路径也不行,因为asp里加了拒绝外调的代码,就比如那个下载的防盗链~~ :)
我也采集过很多网站,但是这种类型的在新闻连接的位置我一直搞不定。
得出来的地址总是到栏目去了,是否这个有防采集呢?
有谁可以采集得出来?把设置贴出来看看?
没什么呀,我的软件可以采。
QQ:471969445
上面说的,随即模板可能会难倒普通的采集,好像难不到我。呵呵。
我是专业做采集的,就是知道,又怎么好随便说出来呢?
如果你愿意,我悄悄的告诉你。呵呵
QQ:471969445
email:tenglizhe
1、用javascript函数弹出目标html页就不会被采集了吧
2、不用get方式翻页,就不能被采集了吧?
用脚本来制作就会减少被采集的次数。
难哦,想了一个晚上没想出来
不错~我就不知道怎么防了!采集共享吗!合乎饿