python爬取小说存储至Mysql并用 django框架做了搜索呈现界面【爬虫-mysql阶段】

环境:pycharm3.6 mysql django
爬虫解析方式:bs4 +正则

爬取小说的网站: 笔下文学网 https://www.bxwxorg.com/
需求:获取玄幻、武侠、都市、历史 四类所有小说的信息 ,包括6个字段(book_id,小说名,小说作者,小说简介,小说最近更新时间,小说海报)

一、分析uirl:
在这里插入图片描述
点击进入玄幻类,发现共有50页 ,每页30本小说,点击第二页 url发生变化:
在这里插入图片描述
通过页数传递了参数 ,再来分析源代码
在这里插入图片描述
然后再随便打开了一本小说 分析源代码 :
在这里插入图片描述
发现是通过传递这本书的book_id 获取这本书的具体信息 ,于是要获得4个类的所有小说的信息,那么前提是要获得所有小说的book_id,再用book_id来逐个获取需要字段的信息。

二、爬虫代码实现
2.1 几次探索发现 所有类(玄幻、武侠等)的小说的第一页存储小说的class id == 和后面的n页是不相同的,这意味着第一页和后面的response不能用一种方法来解析,所以我先处理了所有小说类的第一页 ,然后在同时处理其他类的n页。
spider代码如下:

import requests
import re
import bs4
import time
import random
import pymysql

#打印报错url日志
def log_error(url):
    error_list=
  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python游戏数据采集分析可视化系统是基于Django框架开发的,该系统旨在通过爬虫技术获取游戏数据,并通过数据分析和可视化展示,帮助用户了解游戏情况和进行数据决策。 系统的主要功能包括如下几个模块: 1. 爬虫模块:通过编写爬虫代码,从游戏官方网站或其他相关站点获取游戏数据。爬虫可以实现自动化的数据采集,可以按照设定的规则定时抓取数据,确保数据的及时性和准确性。 2. 数据库模块:系统使用数据库来存储采集到的游戏数据,常用的数据库选择可以是MySQL、SQLite等。通过Django框架提供的ORM技术,可以方便地对数据库进行增、删、改、查的操作,以及对游戏数据进行管理。 3. 数据分析模块:通过数据分析技术,对采集到的游戏数据进行统计、分析、挖掘。可以使用Python的科学计算库如NumPy和Pandas进行数据处理,通过统计学、机器学习等方法,揭示游戏数据背后的规律和趋势。 4. 可视化模块:通过数据可视化技术,将游戏数据以图表、地图等形式直观展示,帮助用户更好地理解数据,并进行数据决策。可以使用Python的可视化库如Matplotlib和Seaborn进行图表绘制,或者使用JavaScript的可视化库如D3.js实现更复杂的可视化效果。 5. 源码开放性:系统的源码可以根据用户需求进行自定义修改和扩展。Django框架具有良好的可拓展性,用户可以根据自己的需求添加新的功能、优化系统性能等。 总之,Python游戏数据采集分析可视化系统使用Django框架进行开发,通过爬虫实现数据采集,数据分析和可视化模块对数据进行处理和展示。系统源码的开放性使得用户可以根据实际需求自定义修改和扩展功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值