在pip文件夹里面新建一个文件叫做 pip.ini ,内容写如下即可
[global]
timeout = 6000
index-url = https://mirrors.aliyun.com/pypi/simple/
trusted-host = mirrors.aliyun.com
linux
(1)cd ~
(2)mkdir ~/.pip
(3)vi ~/.pip/pip.conf
(4)编辑内容,和windows一模一样
- 需要安装:
- pip install bs4
- pip install lxml
1 数据解析的原理:
# -1.标签定位
# -2.提取标签、标签属性中存储的数据值
2 bs4数据解析的原理:
# -1.实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中
# -2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取