现在要解决的问题如下:
我们有一个数据的表
第7列有许多数字,并且是用逗号分隔的,数字又有一个对应的关系:
我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个
好了,我给的解决方法如下:
#!/bin/python
#-*-coding:UTF-8-*-
import pandas as pd
import numpy as np
dfidspec = pd.read_table("one.txt")#这个是对应关系的文件
dfmgs = pd.read_table("two.txt",header = None)#这个是我们数据的表
def getlistnum(li):#这个函数就是要对列表的每个元素进行计数
set1 = set(li)
dict1 = {}
for item in set1:
dict1.update({item:li.count(item)})
return dict1
bigdict = dict(zip(dfidspec['ID'],dfidspec['class']))#获得一个关系的字典
dfmg