Scrapy异步插入关系型数据库
原因分析
在使用scrapy时需要从互联网上抓取较多的数据进行保存到数据库时,如果使用平时的直接插入数据库时,由于插入的动作会比解析得到数据的动作慢很多,就会导致数据的堵塞,致使较多数据堆积。
解决方案
在scrapy中可以使用twisted异步加载的方法,使得对数据库的操作是异步进行的,这样可以大大提高插入数据库的效率
1.引入库
1 | from twisted.enterprise import adbapi |
2.实例化一个类
1 | class MysqlTwistedPipeline(object): |
3.settings配置(自行添加)
1 |
|