readDataToDic.py文件升级改版(附加各个属性的list、dic方法)

#coding=utf8
import csv 
import logging
import os
'''
Author:ewang
Data:2017/07/12
该模块的主要功能函数:
readDataToList():把csv中的数据,数据项以字典类型存储在列表中。
getAllServiceId():获取所有的serviceId列表
printListData():输出数据list中的每项数据
createDataDic():创建一个数据字典表,以serviceId为key,相同的数据项列表为value
printDicData():输出数据字典中的每项数据
'''

PATH=lambda p:os.path.abspath(os.path.join(
    os.path.dirname(__file__), p))

logging.basicConfig(level=logging.DEBUG,
                format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                datefmt='%a, %d %b %Y %H:%M:%S',
                filename=PATH('../Log/readDate.log'),
                filemode='w')

class GenExceptData(object):
    def __init__(self,filePah=PATH("../LastCSV/20170510174450.csv")):
        try:
            #存放csv中读取的数据
            self.mdbuffer=[]
            #打开csv文件,设置读的权限
            csvHand=open(filePah,"r")
            #创建读取csv文件句柄
            readcsv=csv.reader(csvHand)
            #把csv的数据读取到mdbuffer中
            for row in readcsv:
                    self.mdbuffer.append(row)  
            #把数据穿件为为字典类型的
        except Exception,e:
            logging.error("Read Excel  error:"+e) 
        finally:
            #关闭csv文件
            csvHand.close()
  
    def readDataToList(self):
        try:
            #在数组最后添加一个空白行
            #该行的作用是为了成功获取最后一条json数据
            #在数组endLine添加空白字符
            endLine=[" " for num in range(len(self.mdbuffer[1])) if num>=0] 
            #把以空字符的endLine添加到末尾
            self.mdbuffer.append(endLine)
            #获取mdbuffer中的元素个数
            rowNumber=len(self.mdbuffer)
            #设置当前行号
            currentrow=1
            #设置json数据的属性值
            propertyJson={}
            #读取列表中的元素   
            dataList=[]  
            try: 
                for row in range(1,rowNumber):
                    #创建一个临时变量用来存取一次循环的属性键值
                    temp={}
                    #获取列表中一个元素
                    item=self.mdbuffer[row]
                    #获取当前元素,当前元素代表的是每个
                    #事件起始的位置
                    currentItem=self.mdbuffer[currentrow]
                    #获取serviceId并进行解码
                    mdEvent=currentItem[0].decode("gbk")
                    serviceId= currentItem[2].decode("gbk")
                    #获取属性并进行解码,把解码的值存入propertyName
                    propertyName=item[3].decode("gbk")
                    #获取属性值并进行解码,把解码的值存入propertyValue
                    propertyValue=item[4].decode("gbk")
                    try:
                        #判断埋点事件与serviceId是否相等
                        if item[0]==currentItem[0] and item[2]==currentItem[2]:
                            #用来保存埋点事件
                            propertyJson["mdEvent"]=mdEvent 
                            #把serviceId方式字典propertyJson中
                            propertyJson["serviceId"]=serviceId 
                            #把属性/值对放入temp字典中                                                 
                            temp[propertyName]=propertyValue
                            #调用字典的update函数,把temp中的键值对
                            #添加到 propertyJson字典中
                            propertyJson.update(temp)
                            #使用continue,如果为if条件为true则循环执行if语句模块
                            continue  
                        else:
                            #把行号设置为当前行
                            currentrow=row  
                            #把当前的属性解码放入propertyName                    
                            propertyName=currentItem[3].decode("gbk")
                            #把当前的属性值解码放入propertyName
                            propertyValue=currentItem[4].decode("gbk")
                            #用来保存埋点事件
                            mdEvent=currentItem[0].decode("gbk")
                            #把serviceId方式字典propertyJson中 
                            propertyJson["serviceId"]=serviceId    
                            #把属性/值对放入propertyJson字典中  
                            propertyJson[propertyName]=propertyValue
                            #propertyJsonList.append(propertyJson) 
                            dataList.append(propertyJson)
                            '''
                            在这说下:
                            propertyJson.clear()与propertyJson={}的区别:
                            propertyJson.clear()是删除字典的值,不创建引用,会改变字典本身的值;
                            propertyJson={}是创建新的引用,字典的中的值不发现变化;
                            如果想让 self.dataDic.append(propertyJson)该语句执行成功,而且添加每次循环的值,
                            需要使用propertyJson={}方法;
                            如果使用propertyJson.clear(),只会把最后一次propertyJson存储的值,添加到self.dataDic中
                            '''
                            propertyJson={}
                    except Exception,e:
                        logging.error("Get Property Json Error:" +e) 
                        #print "Get Property Json Error:",e
            except Exception,e:
                logging.error("Get Date Error:"+e) 
                #print "Get Date Error:",e
            #返回dataList
            return  dataList     
        except Exception,e:
            #把信息写入日志中
            logging.error("Reading Data TO Dic Error:"+e) 
            #print "Reading Data TO Dic Error:",e
     
    def __propertyValueList(self,propertyName): 
        try:
            #调用readDataToList函数创建一个数据list
            dataList=self.readDataToList()
            #把数据list中的所有propertyName放入表propertyValueList中
            propertyValueList=[item[propertyName] for item in dataList if item[propertyName] ] 
            #对propertyValueList中的数据去重,分为两步:
            #第一步把列表转换成集合:set(propertyValueList)
            #第二步:把集合转换为list:list(set(propertyValueList))
            #集合和list的区别:集合中的数据是唯一性,不存在相同部分
            propertyValueList=list(set(propertyValueList))
            #返回serList
            return propertyValueList
        except Exception,e:
            print "Create Property Value  List Error:",e
     
        
    #获取所有serviceId列表  
    def getAllServiceId(self,):
        
        return self.__propertyValueList("serviceId")
       
    #获取所有srcPage列表  
    def getAllsrcPage(self):
        return self.__propertyValueList("srcPage")
    
    #获取所有srcPageId列表  
    def getAllsrcPageId(self):
        return self.__propertyValueList("srcPageId")
      
    #获取所有srcModule列表        
    def getAllsrcModule(self):
        return self.__propertyValueList("srcModule")
    
    #获取所有itemId列表        
    def getAllitem(self):
        return self.__propertyValueList("item")
        
    #获取所有itemId列表        
    def getAllitemId(self):
        return self.__propertyValueList("itemId")    
    
    #获取所有srcPosition列表        
    def getAllsrcPosition(self):
        return self.__propertyValueList("srcPosition")    
    
    #获取所有memberType列表        
    def getAllmemberType(self):
        return self.__propertyValueList("memberType")  

    #获取所有eventGroup列表        
    def getAlleventGroup(self):
        return self.__propertyValueList("eventGroup")   
    
    #获取所有albumType列表        
    def getAllalbumType(self):
        return self.__propertyValueList("albumType")   
    
    #获取所有srcSubModule列表        
    def getAllsrcSubModule(self):
        return self.__propertyValueList("srcSubModule") 
    
    #获取所有type列表        
    def getAlltype(self):
        return self.__propertyValueList("type") 
    
    #获取所有function列表        
    def getAllfunction(self):
        return self.__propertyValueList("function")  
    
    #获取所有shareType列表        
    def getAllshareType(self):
        return self.__propertyValueList("shareType")    
   
          
            
    #输出list中的数据信息                                  
    def printListData(self):
        try:
            #调用readDataToList方法获取dataList列表
            dataList=self.readDataToList()
            #对列表中的数据执行for循环
            #并输出类似与json样式的数据
            for item in dataList:                            
                    print "{"   
                    #输出键值对
                    for key,val in item.items(): 
                        print "\t",key,":",val,","
                    print "}"
                    #设置以#格式的分隔符
                    print "#"*50
        except Exception,e:
            logging.error("OutPut  List Data  Error:"+e)
            #print "OutPut  List Data  Error:"+e
    
    #创建数据字典
    def __createDataDic(self,properyName,propetyList):
        try:
            #定义个数据字典变量
            dataDic={}    
            #调用函数readDataToList创建一个dataList表  
            dataList=self.readDataToList()   
            #判断列表中是否有元素,如果有执行if语句
            if len(propetyList)>0 and len(dataList)>0:
                #对propetyList进行循环,以property作为key
                for Property in propetyList:
                    #创建一个list用来存放Property相同的数据项
                    samePropertyJosnList=[]
                    #对数据列表执行循环
                    for item in dataList:
                        #获取字典中键为Property值,放入变量中                  
                        itemProperyName=item[properyName]
                        #如果值不为空,执行if语句
                        if itemProperyName:
                            #判断Property与数据项中itemProperyName的值是否相等
                            #如果相等执行if语句块
                            if Property==itemProperyName: 
                                #把数据项加入samePropertyJosnList列表中
                                samePropertyJosnList.append(item)                                                              
                        else:
                            logging.debug("Property is null")
                    #给字典赋值,以Property作为key,
                    #Property相同的数据项列表作为值
                    dataDic[Property]=samePropertyJosnList                     
            else:
                logging.debug("Property List  or dataList is null")
            #返回字典类型的数据
            return dataDic
        except Exception,e:
            logging.error("Create Data Dictionary Error:"+e)
        
     
    def get_ServiceId_DataDic(self):
        try:
            servicIdList=self.getAllServiceId()
            return self.__createDataDic("serviceId", servicIdList)
        except Exception,e:
            logging.debug("create serviceId data dictionary:"+e)
                     
    def get_srcPage_DataDic(self):
        try:
            srcPageList=self.getAllsrcPage()
            return self.__createDataDic("srcPage", srcPageList)
        except Exception,e:
            print "create srcPage data dictionary:",e
            
            
    def get_srcPageId_DataDic(self):
        try:
            srcPageIdList=self.getAllsrcPageId()
            return self.__createDataDic("srcPageId", srcPageIdList)
        except Exception,e:
            logging.debug("create srcPageId data dictionary:"+e)     
            
    def get_srcModule_DataDic(self):
        try:
            srcModuleList=self.getAllsrcModule()
            return self.__createDataDic("srcModule", srcModuleList)
        except Exception,e:
            logging.debug("create srcModule data dictionary:"+e)     
            
     
    def get_item_DataDic(self):
        try:
            itemList=self.getAllitem()
            return self.__createDataDic("item", itemList)
        except Exception,e:
            logging.debug("create item data dictionary:"+e) 
            
    def get_itemId_DataDic(self):
        try:
            itemIdList=self.getAllitemId()
            return self.__createDataDic("itemId", itemIdList)
        except Exception,e:
            logging.debug("create itemId data dictionary:"+e)    
        
    def get_srcPosition_DataDic(self):
        try:
            srcPositionList=self.getAllsrcPosition()
            return self.__createDataDic("srcPosition", srcPositionList)
        except Exception,e:
            logging.debug("create srcPosition data dictionary:"+e)        
         
    def get_memberType_DataDic(self):
        try:
            memberTypeList=self.getAllmemberType()
            return self.__createDataDic("memberType", memberTypeList)
        except Exception,e:
            logging.debug("create memberType data dictionary:"+e)   
            
    def get_eventGroup_DataDic(self):
        try:
            eventGroupList=self.getAlleventGroup()
            return self.__createDataDic("eventGroup", eventGroupList)
        except Exception,e:
            logging.debug("create eventGroup data dictionary:"+e)  
            
    def get_albumType_DataDic(self):
        try:
            albumTypeList=self.getAllalbumType()
            return self.__createDataDic("albumType", albumTypeList)
        except Exception,e:
            logging.debug("create albumType data dictionary:"+e) 
            
    def get_srcSubModule_DataDic(self):
        try:
            srcSubModuleList=self.getAllsrcSubModule()
            return self.__createDataDic("srcSubModule", srcSubModuleList)
        except Exception,e:
            logging.debug("create srcSubModule data dictionary:"+e)   
            
    def get_type_DataDic(self):
        try:
            typeList=self.getAlltype()
            return self.__createDataDic("type", typeList)
        except Exception,e:
            logging.debug("create type data dictionary:"+e)      
            
    def get_function_DataDic(self):
        try:
            functionList=self.getAllfunction()
            return self.__createDataDic("function", functionList)
        except Exception,e:
            logging.debug("create function data dictionary:"+e)      
            
    def get_shareType_DataDic(self):
        try:
            shareTypeList=self.getAllshareType()
            return self.__createDataDic("shareType", shareTypeList)
        except Exception,e:
            logging.debug("create shareType data dictionary:"+e)  
                            
    #打印字典信息         
    def printDicData(self,propertydic):
        try:            
            #对字典中的数据进行循环,获取键值对
            for Property,dataitem in propertydic.items():                      
                    print "{"   
                    print "\t",Property,":","["   
                    #由于值是列表,列表中的数据项类型是字典类型
                    #每一数据项是哈希表
                    for item in dataitem:
                        print "\t\t{"
                        #输出哈希表中的数据
                        for key,val in item.items(): 
                            print "\t\t\t",key,":",val,","
                        print "\t\t},"
                    print"\t]"
                    print "}\n"
                    print "#"*50
        except Exception,e:
            print "print data error:",e
    
    def getDicDataValue(self,serviceId="pageview"):
        try:
            dataDic=self.createDataDic()
            if serviceId:
                return dataDic[serviceId]
        except Exception,e:
            logging.error("Get Dic Data Error:"+e)
            #print "Get Dic Data Error:",e
def test():
    filepath="../LastCSV/20170510174450.csv"
    gen =GenExceptData(filepath)
    print gen.getAllsrcPage()
    srcpatdic=gen.get_ServiceId_DataDic()
    gen.printDicData(srcpatdic)
    #print gen.getDicDataValue()
    
if __name__=="__main__":
    test()
该脚本在之前的基础上进行优化,通过对各个属性值分类,写入相应的list,根据相应的list,构造相关的dict,用于后期json数据的比对,改代码在调试阶段,只供参考!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WEL测试

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值