在mac上使用很顺利。在Windows下面有踩到一些坑,记录一下。方便以后查阅
首先安装注意安装最新版的3X且是64位的。当前最新版下载地址
https://www.python.org/downloads/release/python-382/
安装的时候最好自己选择一个非C盘的目录,不然之后安装pip等装插件会提示没有权限。
环境变量path添加Python的路径 这样才能使用pip
进入刚刚安装时选择的Python目录,在Lib目录下 地址栏输入cmd打开命令行窗口
爬网页需要用到的包
pip install requests
pip install beautifulSoup4
pip install python-xlwt
pip3 install lxml
有可能需要执行以下命令升级pip
python -m pip install --upgrade pip
敲黑板,划重点!
在PyCharm里面使用时配置
在view->appearance->toolbal 把扳手搞出来也就是setting快捷键是 ctrl+alt+s
点扳手
选到 project:xxx你工程名字
第一个 pproject interpreter 配置一下 配置的刚刚装的python
pycharm里面鼠标悬浮会提示导包
demo
import requests
from bs4 import BeautifulSoup
import re
import xlwt
url = 'https://www.xxx.com/'
response = requests.get(url)
response.encoding=response.apparent_encoding
#因为网站使用的不是通用的utf-8格式,而是gzip,所以要让它判断解码格式
html = BeautifulSoup(response.text,'lxml')
print(html)