python爬虫笔记_01

本文介绍了Python编程中常用的四个库:requests用于网络请求,BeautifulSoup帮助解析HTML,re实现正则表达式操作,pandas则支持数据处理与分析。掌握这些库将助力您的信息技术项目高效进行。
摘要由CSDN通过智能技术生成

1、常用库

1.1、requests

requests 库是 Python 的一个第三方库。

安装 Python3 ,可直接使用 pip3安装requests 库:

pip3 install requests

 

1.2、Beautiful Soup(bs4)

Beautiful Soup 库一般被称为bs4库,支持Python3,是写爬虫非常好的第三方库。

可直接使用 pip在命令行进行安装:

pip install beautifulsoup4

1.3、re

re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

1.4、pandas

Pandas 是 Python 语言的一个扩展程序库,用于数据分析。

Pandas 提供高性能、易于使用的数据结构和数据分析工具。一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。

Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值