a =len(df[df['性别']=='女'])
b =len(df[df['性别']=='男'])
c =len(df[df['性别']!='男'])-len(df[df['性别']=='女'])print('男明星的人数为:%s'%b)print('女明星的人数为:%s'%a)print('性别不详的人数为:%s'%c)
defXZ(name):
num =len(df[df['星座']== name])return num
name =['白羊座','金牛座','双子座','巨蟹座','狮子座','处女座','天秤座','天蝎座','射手座','摩羯座','水瓶座','双鱼座']
dic ={}sum=0for i in name:
num = XZ(i)#print('{}的明星有{}位'.format(i,num))sum=sum+ num
dic[i]= num
#print('未知星座的明星有{}位',len(df)-sum)
dic['other']=len(df)-sumprint(dic)print('最受欢迎的星座是:{},共有{}位明星'.format(max(dic, key=dic.get),dic[max(dic, key=dic.get)]))
defCooperation(name):# 获取索引位置,变为二维数组,变为list,再提取数据
num = df[df['中文名']== name].index.values.tolist()[0]# 将所有人的作品变为list
works = df['代表作品'].values
works = works.astype('str').tolist()# 存储有合作关系的人的姓名
coo_dic ={}# 判断是否为空值if works[num-1]=='nan':print('%s没有与其它明星合作过'%name)else:# 提取当前人的作品,并以'、'分割为列表
work = works[num-1].split('、')# print(work)# 构造遍历整个表格的循环for i inrange(len(df)):# 提取其他人的作品,不包括自己,并以'、'分割为列表if i+1!= num and works[i]!='nan':
work_other = works[i].split('、')# 构造遍历当前人作品的循环for j in work:# 判断当前人的作品是否在其他人的作品出现过if j in work_other:# 存储出现过的人的姓名
coo_dic[df['中文名'].values.astype('str').tolist()[i]]= j
returnprint(coo_dic)
y_or_n =input('是否退出程序(y/n)')while y_or_n !='y':
name =input('请输入需要查询合作信息明星的姓名:')if name in df['中文名'].values.astype('str').tolist():
Cooperation(name)else:print('没有该明星的相关信息,输入错误')
y_or_n =input('是否退出程序(y/n)')