环境配置
- python 3.7.3
- pycharm
- win10
- pandas0.24.2
1.pandas库安装
使用cmd 通过pip install pandas 安装pandas库
1.安装的过程中遇到了一些问题,最后使用 管理员模式 运行 cmd解决了问题
2.安装错误信息提示 Time Out 可能是因为软件源的问题,可以通过换源操作解决
1.1 pip国内的一些镜像
- 阿里云 https://mirrors.aliyun.com/pypi/simple/
- 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
- 豆瓣(douban) https://pypi.douban.com/simple/
- 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
- 中国科学技术大学 https://pypi.mirrors.ustc.edu.cn/simple/
1.2 修改源方法:
- 临时使用:
可以在使用pip的时候在后面加上-i参数,指定pip源
eg: pip install scrapy -i https://pypi.mirrors.ustc.edu.cn/simple/ - 永久使用:
linux:
修改 ~/.pip/pip.conf (没有就创建一个), 内容如下:
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
windows:
直接在user目录中创建一个pip目录,如:C:\Users\xx\pip,新建文件pip.ini,内容如下
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
2.创建.csv文件
之前在网上看了pandas读取csv文件的帖子,自己操作的时候却没有成功,后来发现是因为自己在创建csv文件的时候,出现了问题
1.新建一个记事本,输入以下内容(注意其中的 逗号, 为英文的 逗号, 注意区分中文)
2.文件->另存为
更改后缀名为:.csv
编码:选择UTF-8
保存
3.使用Excel打开test.csv文件如下:
3.简单的代码实现
import pandas as pd
dataset = pd.read_csv('test.csv')
print(dataset)