python url编码_python实现简单爬虫

前段时间将python的基础写在了头条号里面,最近一段时间在研究前端知识和laravel框架,把python的代码放了,今天不忙写了一个简单的爬虫。下面是代码(基于3.7版本):

c2f9f7aa076555f4356eed84fa6cdbca.png

Python

# -*- coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoupimport pymysql# 初始化方法def start_method():    get_url = set_path()    print(get_url)  # 基础信息设置,拼合 urldef set_path():    # 基础url链接    base_url = 'http://dl.sll.cn/major/'    # 定义链接组    url_array = []    # 设置起始点    start_num = 1    # 设置终点    end_num = 10000    # 循环生成url链接    for i in range(start_num, end_num):        # 拼接完整url        url = base_url + str(i) + '.html'        url_array.append(url)    return url_array    # print(url_array)# 获取 html # 获取内容并写入库def start():    # 获取拼合后的url链接    url_array = set_path()    for url in url_array:        # 获取链接的信息(状态码、url、头信息、cookie、源码等)        content = requests.get(url)        # 设置编码格式        content.coding = 'UTF-8'        # 以文本形式获取源码        content_text = content.text        # 利用解析器进行解析操作        article = BeautifulSoup(content_text)        # 标题        title = article.title.string        # 写入数据库        mysql_connect(title, url)  # 连接数据库def mysql_connect(title, url):    con = pymysql.connect(            # 数据库地址            host='127.0.0.1',            # 端口            port=3306,            # 用户名            user='root',            # 密码            password='shenlin',            # 数据库名称            database='school',            # 编码设置            charset='utf8'        )    # 得到连接光标    connect = con.cursor()    # 书写 SQL 语句    sql = 'INSERT INTO test(title, url) VALUES("%s","%s")' % (title, url)    # 执行SQL,并获取结果    res = connect.execute(sql)    # 关闭数据库连接    connect.close()    con.close()     if res:        print(url + '------> 写入成功')    else:        print(url + '------> 写入失败')  # 初始化调用方法start()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值