风讯官方论坛FoosunCMS交流区Foosun3.x安装使用[求助]碰到使用utf-8字符的网页如何采集?

1  /  1  页   1 跳转 查看:677

标题: [求助]碰到使用utf-8字符的网页如何采集?

[求助]碰到使用utf-8字符的网页如何采集?

很多网页采用utf-8字符,它的源文件中汉字都为乱码,碰到这种情况如何采集成正常文字?
引用
 

还没碰到过,举个例子大家来研究下
引用
 

查看源文件把他保存为ANSI格式,然后自找截取标志,不过你的模板最好也要采用utf-8编码方式,否则即使采集下来,也不能正常显示。


试一下吧,实在不行把站点帖出来大家一起研究。

引用
 

对啊,具体采集哪些内容啊?是不是那些学校的介绍?
引用
 

采集可以,显示不出正常的文字,设置模板为utf-8编码经测试是不行的。这类文章再数据库中已经是utf-8编码了,读出时经过浏览器自动识别和转换。采集系统是对html页进行读取,怎么会涉及内部字符集?再研究下。


附站点:


http://www.china.com.cn/chinese/index.htm


[此贴子已经被作者于2005-4-20 21:03:53编辑过]

引用
 

更正上一回复


如果设置模板为 charset=utf-8,那么是可以显示经过utf-8编码的文字,虽然他采集和入库时都是“乱码”,当然就不能修改了,总而言之,我们可以采集和显示,然后用一个模板来发布即可。


utf-8编码是国际化趋势,如果整个系统都改为utf-8未尝不是好事,我先试试将风讯编辑器的字符集都改为utf-8看看可能编辑文字。

引用
 

呵呵,也是一路高手哦。有这方面的经验多交流。
引用
 
1  /  1  页   1 跳转

版权所有 Foosun.NET  NewsCMS.com  NewsIDC.COM  Sitemap

Powered by Discuz!NT 2.0.1115    Copyright © 2001-2008 Comsenz Inc.
Processed in 0 second(s) (Cached).
返顶部