python---列表2

列表


num = [1,23,4,5]
num.sort ()
#即可得到从小到大的排序

num.sort(reverse=Ture)
#即可得到从大到小的排序

num.copy()
#复制到一种操作 

#将集合0-10中的数全都平方


num = []
for i in range(1,11):
     num.append(i**2)
print(num)

 或者


num = [i**2 for i in range(11) if i >0]
print(num)

 
1.pandas的Series库引用示例:


import pandas as pd
data = [22222,44444,22221,6767676,555555]
city = ['GD','JS','SH','SZS','LYG']
GDP = pd.Series(data,index=city)
print(GDP)

pandas的DataFrame库引用示例:

import pandas as pd 
data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}
city= ['GD','JS','SD','ZJ']
df= pd.DataFrame(data, index=city)
print(df)

它们都共有3种属性
1..dtypes---->导出类型
2..index---->导出索引
3..values---->导出值

2.pandas中读取CSV文件主要使用:


pd.read_csv()函数
将文件路径传入,经过处理后可得到DataFrame格式的数据
行索引:index
列索引:columns

CSV的文件路径:


使用Windows系统的同学在自己的电脑上运行代码时,需要注意路径前要加一个r表示字符串不需要转义。
如:

pd.read_csv(r"D:\Users\yequ\电商数据清洗.csv")


需要得到:


import pandas as pd
data = pd.read_csv("/Users/yequ/电商数据清洗.csv")
print(data)

1.防止乱码:


使用pd.read_csv()方法读取csv格式文件的时候,常常会因为csv文件中带有中文字符造成读取文件错误。
此时,我们可以将参数encoding设置为"utf-8"。
格式:

encoding="utf-8"

2.指定index - index_col:


对于这种情况,pd.read_csv()函数提供了一个参数:index_col,将 列名作为字符串 传入该参数便可以指定index。
在这里,我们指定 "order_id" 这一列作为index。具体代码如下:
使用pd.read_csv()函数读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件
并通过参数index_col来指定"order_id"列为index
将结果赋值给变量data,


data=pd.read_csv("/Users/yequ/电商数据清洗.csv",index_col="order_id")

3. 读取指定列 - usecols:


针对只需要读取数据中的某一列或多列的情况,pd.read_csv()函数提供了一个参数:usecols,将包含对应的columns的列表传入该参数即可。
比如,只读取 "payment" 和 "items_count" 这两列数据的具体代码如下:
TODO 使用pd.read_csv()函数和usecols参数
读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里:
"payment"和"items_count"这两列中的数据
并将结果赋值给变量data


data=pd.read_csv("/Users/yequ/电商数据清洗.csv",usecols=["payment","items_count"])

4. 添加columns:


如果CSV文件没有列名,那么使用pd.read_csv()函数就是从第一行直接开始数据的录入了。
这时,就需要给数据添加上columns,让数据变得完整。
TODO 使用pd.read_csv()函数、header参数和names参数
读取路径为 "/Users/yequ/order_withoutColumns.csv" 的CSV文件
将数据的columns设置为:"订单号","用户id","支付金额","商品价格","购买数量","支付时间"
将结果赋值给变量data
data = pd.read_csv("/Users/yequ/order_withoutColumns.csv",header=None,names=["订单号","用户id","支付金额","商品价格","购买数量","支付时间"])

总结:


1. 防止乱码 - encoding="utf-8"
2. 指定index - index_col
3. 读取指定列 - usecols
4. 添加columns - header=None 和 names

3.DataFrame对象中索引方式:


1. 访问一列元素:data["columns_1"]
2. 访问多列数据: data[["columns_1","columns_2",...]]
   对外层括号表示对data进行索引,第二个中括号表示列表
 

  • 21
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值