查看源文件把他保存为ANSI格式,然后自找截取标志,不过你的模板最好也要采用utf-8编码方式,否则即使采集下来,也不能正常显示。
试一下吧,实在不行把站点帖出来大家一起研究。
采集可以,显示不出正常的文字,设置模板为utf-8编码经测试是不行的。这类文章再数据库中已经是utf-8编码了,读出时经过浏览器自动识别和转换。采集系统是对html页进行读取,怎么会涉及内部字符集?再研究下。
附站点:
http://www.china.com.cn/chinese/index.htm
[此贴子已经被作者于2005-4-20 21:03:53编辑过]
更正上一回复
如果设置模板为 charset=utf-8,那么是可以显示经过utf-8编码的文字,虽然他采集和入库时都是“乱码”,当然就不能修改了,总而言之,我们可以采集和显示,然后用一个模板来发布即可。
utf-8编码是国际化趋势,如果整个系统都改为utf-8未尝不是好事,我先试试将风讯编辑器的字符集都改为utf-8看看可能编辑文字。