风讯官方论坛FoosunCMS交流区dotNETCMS安装使用对于采集入库效率的一点建议

1  /  1  页   1 跳转 查看:140

标题: 对于采集入库效率的一点建议

对于采集入库效率的一点建议

目前在新闻入库的时候,做了一次newsid的重复检测。但程序采用的方式是通过select **** newsid=***这种形式来判断的,这样的话,如果数据库里数据比较多的,频繁操作数据库是非常耗时间,虽然DBMS有着一定的优化,但相对直接内存比对还是要慢不少的,而且会让DBMS的使用率非常高,我现在对20W数据进行入库,基本上cpu就稳定在100%。。。。所以建议用空间换效率,在入库的时候将所有的newsid都读取出来,再做重复检测的时候直接做内存对比。

PS:这样内存占用量不是很大,以前做过写过一个bbs采集系统,百万级的时候内存不超过100M,对于风讯的话可以算一下,一个newsid是12个字节的。12*1000000/1024/1024,即便再加上其他开销,这个还是可以接受的
QQ:55921567
www.roosun.cn
承接网站建设,c#软件开发
引用
 

回复:对于采集入库效率的一点建议

感谢你的建议,我会将这个建议提交给官方的工作人员的.
引用
 
1  /  1  页   1 跳转

版权所有 Foosun.NET  NewsCMS.com  NewsIDC.COM  Sitemap

Powered by Discuz!NT 2.0.1115    Copyright © 2001-2008 Comsenz Inc.
Processed in 0 second(s) (Cached).
返顶部