2021-04-21

python库大全

一、网络爬虫

1、requests  —— 简单的python HTTP请求库

2、BeautifulSoup —— 从HTML或XML中提取数据的python库

3、pyquery —— 网页解析库

4、scrapy —— 爬虫框架

5、pyspider —— 国人编写的网阔爬虫框架

6、selenium —— web应用程序自动化测试

7、scylla —— 代理IP池

8、shreport —— 上海证券交易所上市公司定期报告下载

9、newspaper —— 提取和分析新闻内容的爬虫框架

二、数据分析

1、pandas —— 分析结构化数据的工具

2、modin —— 使pandas运行的更快

3、dask —— 从分块到并行使pandas运行的更快

pip install modin pip install "modin[dask]"

4、plydata —— 提供数据处理语法的Python库,借鉴了R语言dplyr,tidyr和forcats等包中的管道操作符

5、networkx —— 用于创建、操作和研究复杂网络的结构、动态和功能的python库

三、机器学习

1、scikit-learn —— 机器学习必学库,支持监督学习算法和无监督学习算法等等

2、Orange3 —— 处理文本数据

3、doccano —— 文本数据标注工具

4、label-studio —— 多媒体数据标注工具

四、可视化

1、matplotlib —— 画2D或3D的图表

2、seaborn —— 查看数据分布

3、plotnine

preview

4、pyecharts —— 一个用于生成 Echarts 图表的类库

5、plotly —— 动态可视化图绘制库

6、bokeh —— 动态可视化图绘制库

7、SciencePlots ——科研论文绘图

8、datapane —— 数据分析报告生成

9、superset —— 开源商务智能分析可视化库

五、文本分析

1、 nltk —— 自然语言分析套件,对中文不友好

2、spacy —— 工业级自然语言模型库,支持中文

3、pattern —— 自然语言处理、网络分析、可视化库

4、jieba —— 中文文本分词库

5、snownlp —— 中文情感分析库

6、gensim —— 最好用、最全的话题模型

7、cnsenti —— 中文情感分析库

8、label-studio —— 最牛掰的文本数据标注工具

9、doccano —— 文本数据标注工具

10、textstat —— 文本可读性计算包

11、texthero —— 文本预处理、展示、可视化库,仅支持英文

六、GUI 窗体软件开发

1、tkinter —— python内置的GUI库

2、PySimpleGUI —— 最简单的GUI开发库

3、pyqt5、pyside —— 最牛掰的GUI软件开发库

七、自动化办公

1、 zmail —— 自动化收发邮件管理库

2、pywinauto —— Windows电脑自动化python库

3、WeasyPrint —— 自动化生成PDF报告

4、selenium —— 浏览器自动化框架

5、mkdocs —— 基于Python 对 Markdown 非常友好的文档生成器

6、python-docx —— 创建、修改docx文件库

7、python-ppt —— 创建、修改ppt文件库

8、openpyxl —— xlsx文件库

本文内容大多来源于 公众号 —— 大邓和他的Python

 

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值