爬取周公解梦数据(一)

爬取周公解梦主页数据

1.查看周公解梦网站html

在这里插入图片描述

2.代码解析

	url = 'https://www.zgjm.net/b/jiemeng/'
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }
    # json_data = requests.get(url, params=form_data, headers=headers).json()
    json_data = requests.get(url)
    html=json_data.content
    html_doc = str(html,'utf-8')
    soup = BeautifulSoup(html_doc,"lxml")
    urllist = soup.find_all(class_='postitemjm') #获取类为 postitemjm 的标签
    print(urllist)

运行结果:
在这里插入图片描述

3.剩下的就是循环取li标签的href,爬取子页面数据结合数据库保存这些数据

def add_data(type_name,param,key_name):
    url = 'https://www.zgjm.net'+param
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }
    try:
        json_data = requests.get(url)
        html=json_data.content
        # print(html)
        html_doc = str(html,'utf-8')
        soup = BeautifulSoup(html_doc,"lxml")
        content = soup.find(class_='article-content')
        title = soup.find(class_='article-title')

        cur.execute("insert into dream(type,key_name,title,content) VALUES ('"+type_name+"','"+key_name+"','"+str(title.string)+"','"+str(content.text)+"')")
    except UnicodeDecodeError as err:
        print(key_name,"Unicodeerror")
        pass
if __name__ == '__main__':
    conn = pymysql.connect(host=ip,port=port,user='root',passwd='',db='',charset='utf8mb4')
    # print(conn)
    cur = conn.cursor()
    #down_meng()
    add_data('人物','/b/124/','下雪')

    
    cur.close()
    conn.close()

4.最后贴上数据库表结构及所有代码

在这里插入图片描述
数据截图:
在这里插入图片描述

最后是所有代码:

import json
import requests
import time
from bs4 import BeautifulSoup
import pymysql
def add_data(type_name,param,key_name):
    url = 'https://www.zgjm.net'+param
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }
    # json_data = requests.get(url, params=form_data, headers=headers).json()
    try:
        json_data = requests.get(url)
        html=json_data.content
        # print(html)
        html_doc = str(html,'utf-8')
        soup = BeautifulSoup(html_doc,"lxml")
        content = soup.find(class_='article-content')
        title = soup.find(class_='article-title')

        cur.execute("insert into dream(type,key_name,title,content) VALUES ('"+type_name+"','"+key_name+"','"+str(title.string)+"','"+str(content.text)+"')")
    except UnicodeDecodeError as err:
        print(key_name,"Unicodeerror")
        pass
    
def down_meng():
    url = 'https://www.zgjm.net/b/jiemeng/'
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }
    # json_data = requests.get(url, params=form_data, headers=headers).json()
    json_data = requests.get(url)
    html=json_data.content
    html_doc = str(html,'utf-8')
    soup = BeautifulSoup(html_doc,"lxml")
    urllist = soup.find_all(class_='postitemjm')
    # print(urllist)
    arr = {0:"人物",1:"动物",2:"植物",3:"物品",4:"活动",5:"情感",6:"生活",7:"鬼神",8:"自然",9:"建筑",10:"其他"}
    i = 0
    for url_list in urllist:
        li_list = url_list.find_all('li')
        for lilist in li_list:
            print(lilist.a.string,"完成")
            add_data(arr[i],lilist.a['href'],lilist.a.string)
        i = i+1
        conn.commit()
        time.sleep(3)

if __name__ == '__main__':
    conn = pymysql.connect(host=ip,port=port,user='root',passwd='',db=db,charset='utf8mb4')
    # print(conn)
    cur = conn.cursor()
    down_meng()
    # add_data('人物','/b/124/','下雪')
    cur.close()
    conn.close()
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
根据题目描述,算命网源码、风水学、十二星座和周公解梦源码全站伪静态,以及相应的PHP MySQL源码,可以是一个完整的网站项目。以下是对于这个项目的简单介绍。 这个项目基于PHP和MySQL开发,目的是提供算命、风水学、星座和周公解梦等相关服务。整个网站采用全站伪静态技术,提高网站的页面加载速度和搜索引擎优化。 PHP算命网源码部分主要包括用户注册、登录、个人中心、支付等功能。用户可以注册登录账号,查看和编辑个人资料,还可以选择不同的算命服务并进行在线支付。同时,用户可以选择保存历史订单信息,方便查询和管理。 风水学部分包括风水理论介绍、风水布局方案等内容。用户可以了解风水学的基本知识,根据个人情况选择适合自己的风水布局方案。 十二星座部分提供了关于每个星座的性格特点、喜欢的事物以及幸运数字等内容。用户可以根据自己的星座了解更多关于自己的特点和性格,以及星座相关的占星预测。 周公解梦部分提供了对梦境的解析和分析。用户可以输入自己的梦境内容,系统将自动为用户解析梦境的含义和可能的象征。 整个网站的数据存储和管理使用MySQL数据库。PHP和MySQL源码部分包括数据库的设计和创建,以及与前端页面的数据交互功能的实现。这些源码是根据具体需求设计的,实现了用户注册登录、订单管理、风水学、星座信息和周公解梦各功能模块的数据处理和展示。 总之,这个项目提供了算命网站服务的全套解决方案,包括网站前后台源码和数据库设计等。用户可以充分利用这个项目搭建一个完整的算命网站,满足用户的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值