#t40是已经排序好的包含书籍名称的列表。如[“天龙八部”,“天外飞仙”,…] ,
#date1是一个dateframe,date1里的每一行数据,都是如:“天龙八部”(列明1),“价格”,“页数”,“出版日期”,“作者”,“小李飞刀”,“价格”,“页数”,“出版日期”,“作者”。。。。。。
#一共200列
#date1表里的书籍都是t40表里的书籍,且date1的每一行最多有40本书的具体信息,没有书籍信息的地方是NAN
#现在,想将date1里每一行的书籍信息,按t40书籍顺序排序。并且只保留书的价格,页数,出版日期,作者的信息。并生成一个新的dataframe。
b_list=[]
dd=date1.loc[0]
dd1=pd.DataFrame(dd)
list2=[x[0] for x in dd1.values]
a_list=[]
for y in t40:
if y in list2:
a_list.append([list2[list2.index(y)+1]])
a_list.append([list2[list2.index(y)+2]])
a_list.append([list2[list2.index(y)+3]])
a_list.append([re.match("[^’]",list2[list2.index(y)+4]).group()])
else:
a_list.append([0])
a_list.append([0])
a_list.append([0])
a_list.append([0])
a_array=np.array(a