风讯官方论坛

首页 » FoosunCMS交流区 » 插件讨论 » 【讨论】防采集的方法征集,大家一起研究!
小竣 - 2006-3-21 16:47:00

刚跟网友上帝使者聊天时说到防采集,我们能采集别人的信息,就同样会面临被别人采集,

如何有效的防止被采集,这个问题难度不小,但是从采集规则来看防采集,就有了一系列的想法~~  

比如 : 列表页的随机模板调用生成,内容页的随机模板调用生成....

也只是这样说,但是具体还没什么想法,希望潜水中的高手们可以一起出来讨论这个问题~~~

将对一些好的想法给予一定的奖励~~  

活跃起来,风讯的论坛是用来交流的,不是潜水的~~~    请各舒己见!



[此贴子已经被作者于2006-9-4 14:31:02编辑过]

xsh1206 - 2006-3-21 16:54:00

先顶一下



希望各位大虾都说说自己的方法让我们学习学习啊

hn110 - 2006-3-21 23:02:00

有一个方法:

在标题后加上(页码)

比如:标题为 中华人民共和国 共3页

生成:中华人民共和国(1) HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(1)</b></span>

   中华人民共和国(2)HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(2)</b></span>

中华人民共和国(3)HTML 代码为 <span style="font-size:12pt"><b>中华人民共和国(3)</b></span>

哪位老大讲解一下,能解吗??首先声明 :经测试 这样的写法不行:
<span style="font-size:12pt"><b>[标题]([变量])</b></span>
<span style="font-size:12pt"><b>[标题](1)</b></span>

------------------------------------------------------- 小竣 回复 ----
之前 chning  大斑竹跟我说这样的也可采,因为他始终是有共通性的,比如 [标题]([变量]) 这样~~  我技能不高,没解决,现在已经都可以破掉这个了~~

fukai7722 - 2006-3-21 23:09:00

pcgame.com.cn的新闻难采


主要是新闻标题


无论是title



还是新闻的主标题都是变化的..真郁闷

小竣 - 2006-3-22 08:50:00
pcgame.com.cn 我这里打不开,但是说到底生成那里调用模板如果是随机的  应该就能防采集
kiwi - 2006-3-23 08:27:00

pcgame.com.cn可以采的


foosun的采集我没用过,用dede和nc的采集都可以采到,powereasy的也可以的

贱兔 - 2006-3-23 14:08:00

pcgame.com.cn


可以采,他也就两个头,两上内容而已,我都采了


要本着互联网共享的精神,如果大小门户网站,专业类网站都设成防采集了,那我们这些小网站还用生存吗?现在做网站只是一种乐趣,一种爱好!


简单来说防采也就两种方法:(以下属于个人看法,如有雷同,纯属巧合)


一种是硬防(也就是从服务器下手)示例www.ddvip.net 另一种是软防(也就是从程序下手)示例 tech.163.com/school 他生成很多不规则的标识,让你无从下手!栏目页生成几种不同标识,新闻页也有N种分页方式,N种内容、标题等等不一样的标识!


有什么奖励啊!


[此贴子已经被作者于2006-3-23 14:18:21编辑过]

maxgo - 2006-3-23 19:35:00

恩 是个问题

allsky - 2006-3-28 12:07:00
这个帖子……
yuanis - 2006-3-29 00:36:00

我的服务器总是被人采死,CPU长时间100%

------------------------------------------------------------小竣 回复 -----------
现在已经有了防采集的方法,不过可能影响搜索引擎的收录~  就是文章内容页用<script src=**.asp?id=****></script>这样来显示内容~~  采集到的也就是这个 js而已  他本地无,信息又采不到~  他如果在 **.asp前加你站的路径也不行,因为asp里加了拒绝外调的代码,就比如那个下载的防盗链~~  :)

done - 2006-3-30 16:43:00
楼上的,这么夸张啊?
netdust - 2006-4-1 17:18:00
硬防如何防呢?哪位说一下?
qytian - 2006-4-2 14:45:00

我也采集过很多网站,但是这种类型的在新闻连接的位置我一直搞不定。


得出来的地址总是到栏目去了,是否这个有防采集呢?


有谁可以采集得出来?把设置贴出来看看?



http://www.gonet8.com/Article/zw/web/Index.html

teng - 2006-4-5 01:27:00

没什么呀,我的软件可以采。


QQ:471969445

teng - 2006-4-5 02:23:00

上面说的,随即模板可能会难倒普通的采集,好像难不到我。呵呵。


我是专业做采集的,就是知道,又怎么好随便说出来呢?


如果你愿意,我悄悄的告诉你。呵呵


QQ:471969445


email:tenglizhe

qqyou - 2006-4-6 21:53:00
看看
怒剑狂杀 - 2006-4-19 16:22:00

1、用javascript函数弹出目标html页就不会被采集了吧


2、不用get方式翻页,就不能被采集了吧?

小竣 - 2006-4-24 20:28:00
楼上的可否说具体一些?
asdfddddd - 2006-4-26 19:11:00
ding...
asdfddddd - 2006-4-26 19:12:00
ding..
孤独的阿狼 - 2006-4-27 16:32:00

方法好象很不少:


http://www.baidu.com/baidu?tn=GreenBrowser&word=%B7%C0%B2%C9%BC%AF

uyaboy - 2006-4-27 20:35:00
新华网的我就采不出来
yyuj - 2006-4-28 09:30:00

用脚本来制作就会减少被采集的次数。

平凡筱子 - 2006-4-28 16:47:00

难哦,想了一个晚上没想出来

wengrui - 2006-4-28 23:33:00
不太懂~~
qwerqwer - 2006-4-29 03:23:00
高手啊 顶~~
pole - 2006-4-30 15:26:00
新华网的不好采
zxmhyf - 2006-4-30 23:48:00

不错~我就不知道怎么防了!采集共享吗!合乎饿

weilcui - 2006-5-2 18:46:00
我也想知道~!
iooiot - 2006-5-3 06:19:00
呵呵
123
查看完整版本: 【讨论】防采集的方法征集,大家一起研究!