就是采集这一页
http://www.buee.com/joke/302_1.htm
<td width="45%" height=23><a href="javascript:popwin('2102')"><font color="#000099">
你们看
这种新闻列表怎么采集
就是采集这一页
http://www.buee.com/joke/302_1.htm
怎么设置
这种没办法采集,考虑一下怎么修改代码,
如果能采集我再回复你。
列表URL是js生成方式,但
http://www.buee.com/joke/2134.htm 这样的内容地址包含的“上一页”“下一页” 分别导向
http://www.buee.com/joke/2133.htm和 http://www.buee.com/joke/2135.htm
从页面命名可以看出 文件地址(名称)是有规律的。也就是存在通配索引的可能。
因此如果能够不设置url列表页面,而是直接设置索引方式的列表url就可以了,请版主添加此功能。
-----------------------------------
这个功能很有必要,如果列表页面中的url指向内容页,并进行分页。内容页也存在上一页,下一页的分页,两者同时设置后,会产生大量重复采集。
如果上面功能实现,这个问题也就解决了