前言
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。
提示:以下是本篇文章正文内容,下面案例可供参考
一、pandas是什么?
pandas是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。
二、pandas的常用数据类型
1.Series 一维,带标签数组
1.Series创建
可以创建列表,可以创建字典,具体操作如下:
import pandas as pd
import numpy as np
t = pd.Series(np.arange(20))
print(t)
t1 = pd.Series([1,23,3,4,5,6,7,2,4],index=list("a,b,c,d,e"))
#","也算索引
print(t1)
t2 = pd.Series([1,23,3,4,5],index=list("abcde"))
print(t2)
print(t2[["a","b"]])
temp_dict = {"name":"xiaohong","age":"30","tel":10086}
t3 = pd.Series(temp_dict)
print(t3)
t4 = pd.DataFrame(np.arange(12).reshape(3,4))
print(t4)
2.DataFrame 创建
DataFrame创建方法
t4 = pd.DataFrame(np.arange(12).reshape(3,4))
print(t4)
#t5 = pd.DataFrame(np.arange(12).reshape(3,4),index=["a","b","c"],columns=["w","x","y","z"])
三、pandas的切片和索引
切片和索引与python一致,具体代码如下:
t5 = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("wxyzh"))
print(t5)
print(t5[1:3])
print(t5[["w","y"]])
print(t2[["a","b"]])
print(t2.index)
print(t2.values)
print(type(t2.index))
四、pandas之读取外部数据
panda经常应用与读取表格,可以实现提取数据信息,提取不同行,替换信息
import pandas as pd
d = pd.read_csv("C:/Users/18128/Desktop/day04/code/dogNames2.csv")
print(d)
df = pd.DataFrame(np.arange(12).reshape((3,4)),index=list("abc"),columns=list("wxyz"))
print(df)
print(df.head(2))
print(df.tail(1))
print(df.info())
print(df.describe())
print(df.sort_values("y"))
print(df.loc["a","x"]) #ax确定一的点
print(df.loc["a",["x","y"]])#ax,ay确定两个点
print(df.loc["a":,["x","y"]])
print(df.loc[["a","c"],["x","y"]])
print(df.iloc[1:2,[2,3]])
df.loc["a","y"]=100
print(df)
df.iloc[1:2,0:2]=20
print(df)
总结:
例以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法,值得我们更进一步学习.