代码

孤数不证

于 2019-07-21 11:29:35 发布

阅读量97

点赞数

本文链接：https://blog.csdn.net/weixin_43668299/article/details/96704668

版权

该博客讨论了如何将已排序的书籍列表(t40)与包含多本书籍信息的DataFrame(date1)对齐，按照t40的顺序重新排列date1中每行的数据，并仅保留价格、页数、出版日期和作者这四类信息，生成新的DataFrame。通过遍历和匹配方法实现了这一目标。

摘要由CSDN通过智能技术生成

#t40是已经排序好的包含书籍名称的列表。如[“天龙八部”,“天外飞仙”,…] ，
#date1是一个dateframe，date1里的每一行数据，都是如：“天龙八部”（列明1）,“价格”，“页数”,“出版日期”,“作者”，“小李飞刀”，“价格”,“页数”,“出版日期”，“作者”。。。。。。
#一共200列
#date1表里的书籍都是t40表里的书籍，且date1的每一行最多有40本书的具体信息，没有书籍信息的地方是NAN
#现在，想将date1里每一行的书籍信息，按t40书籍顺序排序。并且只保留书的价格，页数，出版日期，作者的信息。并生成一个新的dataframe。

b_list=[]

dd=date1.loc[0]
dd1=pd.DataFrame(dd)
list2=[x[0] for x in dd1.values]
a_list=[]

for y in t40:
if y in list2:
a_list.append([list2[list2.index(y)+1]])
a_list.append([list2[list2.index(y)+2]])
a_list.append([list2[list2.index(y)+3]])
a_list.append([re.match("[^’]",list2[list2.index(y)+4]).group()])
else:
a_list.append([0])
a_list.append([0])
a_list.append([0])
a_list.append([0])

a_array=np.array(a

最低0.47元/天解锁文章

孤数不证

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
代码

b_list=[]dd=did6.loc[0]dd1=pd.DataFrame(dd)list2=[x[0] for x in dd1.values]a_list=[]for y in range(20):if list2[y5] in top_20:a_list.append([list2[y5+1]])a_list.append([list2[y5+2]])a_list.ap...
复制链接

扫一扫