Python3 爬取今日头条(模拟ajax请求)

##Python3 爬取今日头条(模拟ajax请求)

注:本文是跟据博主崔庆才的博客来写的,不单单是思路值得学习,还有代码规范更值得去学习。路漫漫其修远兮,吾将上下而求索。

参考链接:单击跳转
崔庆才的个人博客
新建一个config.py文件,如下

MONGO_URL = 'localhost'
MONGO_DB = 'toutiao'
MONGO_TABLE = 'toutiao'

GROUP_START = 1
GROUP_END = 20

KEYWORD = '街拍'

然后创建一个spider.py文件,内容如下:

import requests
from urllib.parse import urlencode
from requests import RequestException
import json
from json import JSONDecodeError
from bs4 import BeautifulSoup
import re,os
import pymongo
from config import *    #导入之前创建的config.py文件
from hashlib import md5
from multiprocessing import Pool

client = pymongo.MongoClient(MONGO_URL ,connect=False)
db = client[MONGO_DB]

#获取首页Json数据,记为1
def get_page_index(offset, keyword):
    data = {
   
        'offset': offset,
        'format': 'json',
        'keyword': keyword,
        'autoload': 'true',
        'count': '20',
        'cur_tab': '3',
        'from': 'gallery'
    }
    headers = {
   'User-Agent'
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值