我想要这种采集方式,不知道为什么风讯不这样搞呢???

每次采集结束,记录下采集的最后一个页面的连接地址。

下次采集时,检查新闻列表页,找到这个连接,然后从这开始采集。

这样的话就不需要象现在这样,不管页面有没有被采集过,都先尝试采集,完了还得跟数据库比较,看看有没有重复。现在用的方法太苯了,又费资源,又费时间。我上边说的法子多好啊。