python爬虫咋运行_python 爬虫初体验 ———— 一个可运行的爬虫程序

要用到的包可以用pycharm下载:

File->Default Settings->Default Project->Project Interpreter

选择python版本并点右边的加号安装想要的包

28379f19cc131241a947f5c41d592179.png

爬取http://www.weather.com.cn/weather/101190401.shtml天气情况,代码以及解释如下:

# coding :UTF-8

import requests # 用来抓取网页的html源代码

import csv # 将数据写入到csv文件中

import random # 取随机数

import time # 时间相关操作

import socket # 用于异常处理

import http.client # 用于异常处理

from bs4 import BeautifulSoup # 用来代替正则式取源码中相应标签中的内容

# urllib.request:另一种抓取网页的html源代码的方法,但是没requests方便

# 获取网页中的html

def get_content(url):

header = { # header是requests.get的一个参数,目的是模拟浏览器访问 header 可以使用chrome的开发者工具获得,具体方法如下: 打开chrome,按F12,选择network

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值