import pandas as pd #导入pandas包
data = pd.read_csv("2.csv") #读取csv文件
#print (data.head(5))
#print(data.columns)
#print(data.shape)
order = ['time', 'match', 'home', 'score', 'nohome', 'first_half']
data=data[order]
#print (data['score'])
def getlistnum(li): # 这个函数就是要对列表的每个元素进行计数
li = list(li)
#print(li)
set1 = set(li) # 利用集合 把列表中重合的数据删掉
#print("78787878")
#print(set1)
dict1 = {}
dict3={}
for item in set1:
#dict1.update({item: li.count(item)})
dict3.update({item:li.count(item)/215})
return dict3
#print("**************")
#print(df[1])
#print("******")
col_count = getlistnum(data["score"]) # df[0]指列名为0的列,如果你的列名是字符串就要加引号
print(col_count)
dict=pd.DataFrame.from_dict(col_count,orient='index',columns=['score'])
dict=dict.reset_index().rename(columns={'index':'goal'})
dict.head()
print(dict)
爬虫能用到,将爬到的字典转为dataframe格式
最新推荐文章于 2024-04-22 20:49:42 发布