1,多层图片.
比如我采集的新闻页是A.htm,但是A页上全部是图片链接,都是链接到A_01.htm上面的大图片上的,这种情况怎么办?
2.分页.
采集一篇新闻,但是新闻中包含分页,比如第1页,第2页,其中第2页的链接还是链接到原网站上的,这种情况怎么办?
以上两种问题有没有比较好的解决办法?
第一种,把采集地址设为图片链接的地址
第二种,现在还不支持