方法一:(数据量小的时候推荐使用这种)
第一步:pip install mysqlclient
这里我没有报错 也许你可能会报错Read timed out 此时不要慌,这是因为你的网络问题,你使用豆瓣源再次下载:pip install -i https://pypi.douban.com/simple/ mysqlclient
注意:以下针对linux用户(乌班图):可能这时你会报错安装失败,解决方法:
安装命令:sudo apt-get install libmysqlclient-dev
linux用户(centOs):
安装命令:sudo yum install python-devel mysql-devel
1,在pipeline.py中写入如下代码:
import MySQLdb
#采用同步的机制写入mysql
class MysqlPipeline(object):
def __init__(self):
self.conn = MySQLdb.connect('localhost','root','root','article_spider',charset='utf8',use_unicode=True)
self.cursor = self.conn.cursor()
def process_item(self,item,spider):
insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
self.cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
self.conn.commit()
2,在settings.py中写入如下代码:
ITEM_PIPELINES ={'ArticleSpider.pipelines.MysqlPipeline':1,
}
以上是一种插入数据库的方法,下面还有一种:mysql插入的异步方法
**********************************************************************华丽的分割线 ******************************************************************************
方法二:(数据量大的时候推荐使用这种,异步插入关系型数据库)
1,首先在settings.py中配置
MYSQL_HOST = 'localhost'
MYSQL_DBNAME ='article_spider'
MYSQL_USER = 'root'
MYSQL_PASSWORD = 'root'
2,在pipelines.py中贴入代码:
from twisted.enterprise import adbapi
import MySQLdb
import MySQLdb.cursors
#mysql插入的异步化,twisted 提供的异步api
class MysqlTwistedPipline(object):
def __init__(self,dbpool):
self.dbpool = dbpool
@classmethod#方法是固定的,会被spider调用的
def from_settings(cls,settings):
dbparms = dict(
host = settings['MYSQL_HOST'],
db = settings['MYSQL_DBNAME'],
user = settings['MYSQL_USER'],
passwd = settings['MYSQL_PASSWORD'],
charset = 'utf8',
cursorclass = MySQLdb.cursors.DictCursor,
use_unicode = True
)
#**dbparms代表可变化的参数
dbpool = adbapi.ConnectionPool("MySQLdb",**dbparms)
return cls(dbpool)
def process_item(self,item,spider):
#使用twisted将mysql插入变成异步执行
query = self.dbpool.runInteraction(self.do_insert,item)
query.addErrback(self.handle_error,item,spider)
#c处理异步插入的异常
def handle_error(self,failure,item,spider):
print(failure)
def do_insert(self,cursor,item):
#执行具体的插入
insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
致辞插入数据库的方法完成。喜欢的记得点个赞哦。。。谢谢谢谢~~