1、
print('hello world'*3)
显示
hello worldhello worldhello world
2、
# 定义字母表
letters = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z']
#遍历
for i in letters :
print(i)
3、
# 切片
letters[0:3]
4、
letters[:5]
5、
letters[3:]
6、
letters[-3]
7、
# 列表添加对象
x = []
x.append('123')
x.append(['456','789'])
8、
#查看类型
type(x)
9、
# 列表扩展对象
y = []
y.extend('123')
y.extend(['123'])
y.extend(['456','789'])
10、
#删除对象,按位置
y.pop()
#删除对象,按值
y.remove('123')
11、
#元组
x = (1,2,3,4,5,6,7)
print(x[1])
12、
#将元组转化为列表
x_list = list(x)
print(x_list[1])
13、
x.append(8)
14、x_list.append(8)
x_list
15、
# 定义字典
person ={'FName' :'胡立磊','FAge':21}
person['FName']
person['FAge']
16、
#转化为列表-值
person_list = list(person.values())
person_list
17、
#转化为列表,键
person_list2 = list(person)
person_list2
18、
# 定义两个集合
s1 = set([1,2,3,4])
s2 = set([3,4,5,6])
19、
#定义集合的差集
s3 = set.difference(s1,s2)
s3
20、
#定义集合的并集
s4= set.union(s1,s2)
s4
21、
#定义集合的补集
s5 = set.intersection(s1,s2)
s5
22、
# 导入numpy模块
import numpy as np
23、
# 访问数据成员
mydata[1]
24、
type(mydata)
25、
# 定义二维数组
array2 = np.array([[1,2,3],[4,5,6]])
array2
26、
#定义三维数组
array3=np.array([[[1,2,3],[4,5,6]],[[1,2,3],[4,5,6]]])
array3
27、
# 引入模块
import numpy as np
import pandas as pd
28、
# 定义数据框
mydata = np.random.randn(7,4)
col_name = ['x1','x2','x3','x4']
df_data = pd.DataFrame(mydata,columns=col_name)
df_data
29、
# 观察数据
df_data.count()
30、
# 查看头3行
df_data.head(3)
31、
#查看最后3行
df_data.tail(3)
32、
#描述性统计
print(df_data.describe())
33、
# 引入模块
import numpy as np
import pandas as pd
34、
# 定义数据框
mydata = np.random.randn(7,4)
col_name = ['x1','x2','x3','x4']
df_data = pd.DataFrame(mydata,columns=col_name)
df_data
35、
#查看列索引
df_data.columns
36、
#查看值
df_data.values
37、
#查看维度
df_data.shape
38、
#查看数据量
df_data.size
39、
#查看维度
df_data.ndim
40、
#查看数据类型
df_data.dtypes
41、
#查看存储类型
df_data.get_dtype_counts()
42、
# 引入模块
import numpy as np
import pandas as pd
# 定义数据框
mydata = np.random.randn(7,4)
col_name = ['x1','x2','x3','x4']
df_data = pd.DataFrame(mydata,columns=col_name)
df_data
profix_index = df_data.columns.get_loc('x2')
df_data.insert(loc=profix_index,column='bbc',value=df_data['x1']+df_data['x2'])
df_data
43、
#选择一列
x1 = df_data['x1']
x1
44、
#检查类型
type(x1)
45、
df_x1 = df_data[['x1']]
df_x1
46、
#检验类型
type(df_x1)
47、
#选择多列
new_col = ['x1','x2','x3']
df_x123 = df_data[new_col]
df_x123
48、
#添加计算列
df_data['y'] = df_data.sum(axis=1)
df_data
49、
# 选择x开头的列
df_data.filter(like='x')
50、
# 对列进行排序
new_col = ['y','x1','x2','x3','x4']
df_data[new_col]
51、
# 插入列
profix_index = df_data.columns.get_loc('x2')
print(profix_index)
df_data.insert(loc=profix_index,column='bbc4',value=df_data['x1']+df_data['x2'])
df_data
52、
# 引入模块
import numpy as np
import pandas as pd
# 定义数据框
mydata = np.random.randn(7,4)
col_name = ['x1','x2','x3','x4']
df_data = pd.DataFrame(mydata,columns=col_name)
df_data
53、
#行选择,前3行
df_data.head(3)
54、
# 选择索引选择器
df_data.loc[0:2]
55、
# 行选择器
df_data[0:2]
56、
df_data.index
57、
# 行选择器,只支持数值索引
df_data.iloc[0:2]
58、
# 引入模块
import numpy as np
import pandas as pd
# 定义数据框
mydata = np.random.randn(7,4)
col_name = ['x1','x2','x3','x4']
df_data = pd.DataFrame(mydata,columns=col_name)
df_data
59、
#行与列同时选择
df_data.loc[1:3,['x1','x2']]
60、
#行与列的互换
df_data2 = df_data.T
df_data2
61、
#单字段排序
df_data.sort_values('x1',ascending=True)
62、
#多重字段排序
df_data.sort_values(['x1','x2'],ascending=[True,False])
63、
df_data.isnull()
64、
#设置单位格值为NULL
df_data.loc[1,'x1'] = np.nan
#再次检验
df_data.isnull()
65、
#填补值
df_data = df_data.fillna(1)
df_data
66、
#再次检验
df_data.isnull()
67、
#设置单位格值为NULL
df_data.loc[1,'x1'] = np.nan
df_data
68、
#删除行
df_data.dropna()