风讯官方论坛

首页 » FoosunCMS交流区 » 插件讨论 » 为什么图片采集不成功
caizhi2 - 2005-10-31 15:22:00

我要采集的页面是http://www.gytoday.cn/htm/jrzx/gzgy/index.htm


为什么图片总是采集不到。而文字却没有一定问题。请板主帮忙不知可否???

chning - 2005-10-31 15:44:00

你是否设置了保存远程图片?


保存远程图片的目录是否正确?

caizhi2 - 2005-10-31 16:26:00

谢谢版主回答。


我选中了“保存远程图片”。所有的设置,在设置向导里都没有问题。


Const.asp:


Const UserDir = "Users"
'-----生成文件保存路径,后面不能带/,不带虚拟目录-----
Const ClassDir = "ml"
'-----系统的虚拟目录,后面不能带/——-----
Const SysRootDir = ""
'-----文件目录,后面不能带/,不带虚拟目录-----
Const UpFiles = "Files"
'-----自由标签样式文件目录,后面不能带/,不带虚拟目录-----
Const StyleFiles = "Templets/FreeLableStyle"
'-----模板文件目录,,后面不能带/,不带虚拟目录-----
Const TempletDir = "Templets"
'-----远程图片保存目录,后面不能带/,不能带虚拟目-----
Const BeyondPicDir = "BeyondPic"
'-----新闻采集远程图片保存地址,后面不能带/,不带虚拟目录-----
Const SaveImagePath = "BeyondPic"
'-----下载文件存放目录-----
Const DownLoadDir = "DownLoad"
'-----归档新闻列表文件保存路径,后面不能带/,不带虚拟目录-----


不知道是什么原因,就是没有采集到图片。图片文件名已经有了,每个图片是2K。总好像图片没有采集成功。

caizhi2 - 2005-10-31 16:35:00

远程图片保存在


/Files/BeyondPic

chning - 2005-10-31 18:03:00

你检查一下你的


/Files/BeyondPic


这个文件夹存在吗?不存在需要先建立


还有这个文件夹是否有写的权限?

caizhi2 - 2005-10-31 19:49:00
这个文件夹存在。文件夹的权限我已经设置“存档”了,还是不行呀?
天堂流星 - 2005-10-31 19:54:00
你看看你的

/Files/BeyondPic目录下面有没有打不开的图片文件,如果有的话,你用记事本打开就知道是怎么回事了

caizhi2 - 2005-11-1 09:08:00

图像文件保存在Files/BeyondPic/2005-11/1/里。


用记事本打开图片文件内容是:


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<HTML><HEAD><TITLE>无法找到该页</TITLE>
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=GB2312">
<STYLE type="text/css">
  BODY { font: 9pt/12pt 宋体 }
  H1 { font: 12pt/15pt 宋体 }
  H2 { font: 9pt/12pt 宋体 }
  A:link { color: red }
  A:visited { color: maroon }
</STYLE>
</HEAD><BODY><TABLE width=500 border=0 cellspacing=10><TR><TD>


<h1>无法找到该页</h1>
您正在搜索的页面可能已经删除、更名或暂时不可用。
<hr>
<p>请尝试以下操作:</p>
<ul>
<li>确保浏览器的地址栏中显示的网站地址的拼写和格式正确无误。</li>
<li>如果通过单击链接而到达了该网页,请与网站管理员联系,通知他们该链接的格式不正确。
</li>
<li>单击<a href="javascript:history.back(1)">后退</a>按钮尝试另一个链接。</li>
</ul>
<h2>HTTP 错误 404 - 文件或目录未找到。<br>Internet 信息服务 (IIS)</h2>
<hr>
<p>技术信息(为技术支持人员提供)</p>
<ul>
<li>转到 <a href="http://go.microsoft.com/fwlink/?linkid=8180">Microsoft 产品支持服务</a>并搜索包括“HTTP”和“404”的标题。</li>
<li>打开“IIS 帮助”(可在 IIS 管理器 (inetmgr) 中访问),然后搜索标题为“网站设置”、“常规管理任务”和“关于自定义错误消息”的主题。</li>
</ul>


</TD></TR></TABLE></BODY></HTML>

chning - 2005-11-1 09:17:00

这个可能是因为图片路径不对,没有找到图片文件吧

caizhi2 - 2005-11-1 09:29:00

是呀。我感觉是图片没有被采集。请问该如何解决?我采集的网址是:http://www.gytoday.cn/htm/jrzx/gzgy/2005-10-30-34932.htm

caizhi2 - 2005-11-1 09:30:00

采集的新闻代码是:


<table width="95%" height="100" border="0" align="center" cellpadding="0" cellspacing="0" bgcolor="#FFFFFF">
                  <tr>
                    <td valign="top" style="padding-left:10px;padding-right:10px;padding-top:10px "><DIV id=zoom style="FONT-SIZE: 14px; LINE-HEIGHT: 180%">[新闻内容]<!---VB 5.3.0701----></FONT><br><br><DIV></DIV></DIV></td>
                  </tr>
                </table>

chning - 2005-11-1 09:44:00

看了,你打开admin/collect/inc/function.asp的112行附近,


找到 if Left(NewsLinkStr,7) <> "http://" then


修改为: if Left(LCase(NewsLinkStr),7) <> "http://" then


应该可以解决你的问题了。

caizhi2 - 2005-11-1 09:52:00
非常感谢,终于成功了。原来是系统的一个BUG![em01]
天堂流星 - 2005-11-2 11:47:00
这是被做了防盗措施了,
1
查看完整版本: 为什么图片采集不成功