前情概要
感觉以前写爬虫有点依赖github上的代码,和网上的教程,这次打算从头开始写一个爬虫,不用太难但是一定要都是自己写的,所以打算拿豆瓣开始练习。
源代码
开始
提前构思好自己需要的信息类型
book{
book_name, 书名
(?) book_originalname 由于一部分书在网页上没有这个标签 所以放弃了
book_author, 作者
book_ score, 得分
book_quote ,一句箴言
}
选择 豆瓣图书 Top 250 页面
前情概要
感觉以前写爬虫有点依赖github上的代码,和网上的教程,这次打算从头开始写一个爬虫,不用太难但是一定要都是自己写的,所以打算拿豆瓣开始练习。
源代码
开始
提前构思好自己需要的信息类型
book{
book_name, 书名
(?) book_originalname 由于一部分书在网页上没有这个标签 所以放弃了
book_author, 作者
book_ score, 得分
book_quote ,一句箴言
}
选择 豆瓣图书 Top 250 页面