weixin_45019064-CSDN博客

原创爬虫的小应用(1)

简单的目标解析和存储：如何使用requests模块一般都是先引入： import requests 为什么使用requests呢，因位requests比urllib新而且简洁，所以这次选用他 1.指定URL（指定一个网站） url = "www.xxx.com/" 还需要设置一个筛选采集的参数这里设置的字典键值对用来提取信息，提取的类型，要去浏览器先找。例如搜狗搜索一个东西 kw = impot (“请输入一个东西：”) parm = { "query":kw } UA伪装：预防一些低级的反爬

2020-07-13 00:43:48 150

原创 Python爬虫入门笔记（1）

1.首先要在pycharm中准备好几个库（事先下载好）下载方法：在pycharm按照相应的顺序打开到相应的界面，点击3处的加号跳出到4出的搜索框，然后搜索需要的库，点击左下角的安装，即可安装所需的库。 2.在项目页面调用相应的库 from bs4 import BeautifulSoup #网页解析，获取数据 import re #正则表达式，进行文字配 import urllib.request,urllib.error #制定URL，获取网络数据 import xlwt #进行Excel操作 impo

2020-07-05 23:38:30 144

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 爬虫的小应用(1)

原创 Python爬虫入门笔记（1）

空空如也

空空如也

原创爬虫的小应用(1)