Python数据分析常用库
之所以要写这个文章,是用于电脑重装后恢复Python开发环境。
笔者使用Python开发一些小程序来进行数据分析,只具有初级水平,所有列示的常用库,也是目前使用过的,不一定是最优解。
pandas
这个库不需要说明,安装命令:
pip install pandas
openpyxl
pandas 的配套库,也可能是笔者本身不熟悉的原因,每次还需要用到这个库。
pip install openpyxl
tqdm和rich
这是一个进度条库,目前笔者能够找到的比较容易使用的库,需要分别安装,否则使用tqdm.rich的时候就会报rich模块找不到的错误。
pip install tqdm
pip install rich
chardet
chardet库是一个用于检测输入字节序列编码类型的Python库。它能够自动识别文本或二进制数据的编码,支持多种常见的编码格式,如UTF-8、ASCII、ISO-8859-1等。主要是用于读取文件时,判断所用的字符编码
pip install chardet
python-docx
这个库用于操作docx文件。
pip install python-docx
pypinyin
这是一个用于汉语拼音转换的库,需要通过拼音来排序时,需要用到。没用这个库之前,一直没有弄明白Python是怎么对汉字进行排序的。
pip install pypinyin
pyperclip
这是个操作粘贴板的库,用于与程序交互,从windows粘贴板中读写数据。
# 复制到粘贴板
pyperclip.copy("文本内容")
# 读取粘贴板内容
copied_text = pyperclip.paste()
Pyinstaller
这个是打包成exe文件的工具,很好用的,注意生成的文件要拷贝出来,与数据库文件放在同一层,否则可能运行失败。
# 安装库文件
pip install pyinstaller
# 打包,在控制台下面直接打包即可,main.py为入库文件名,.py不要缺。
pyinstaller -D -w main.py