python-----本地各类文件数据采集以及数据存储----读取操作

1、txt文件读取操作

#文件打开操作

filename_url=' ---------------文件在本地存放地址,且使用'/'分隔 -----------------'

#打开文件操作

      #读取操作

           #若文件中含有中文则使用"-------encoding='utf-8'-------"

                file_obj=open(filename_url,mode='r',enconding='utf-8')

           #无中文读取

                file_obj=open(filename_url,mode='r')

           #全部读取'read'

                 all_connect=file_obj.read()

           #逐行读取'readline',以换行符”\n”为结点,逐行读取

                 line=file_obj.readline()

            #逐行读取下一行

                 next_line=file_obj.readline()

            #读取全部内容,返回列表,列表中的每个元素都是行内容'readlines',此种读取每行都会有\n

                 lines=file_obj.readlines()

           

2、CSV文件读操作

#CSV文件类似于Excel文件,用于存储数据,而利用Pandas对CSV文件进行处理较为快捷方便

#导入包
    import pandas as pd
    
    #pandas常用的数据结构:
    
       #Series:类似于以为数组的对象
    
       #DataFrame:表格型数据,可以表示二维或者更高维度的数据

#打开文件并读取
    
    filename_url='---------------文件在本地存放地址,且使用'/'分隔 -----------------'
    
    csv_obj=pd.read_csv(filename_url)
    
    print(type(csv_obj))---------可以获取数据格式
    
    #预览csv数据
    
    csv_obj.head()
    
    #获取单列数据
    
    filtered_data=csv_obj['列名']
    
    #获取多列数据
    

    filtered_data=csv_obj[['列名1','列名2']]

3、JSON文件读操作

#从文件中读取

   #导入包
 
    import json
 
   #读取操作
    filename_url=' ---------------文件在本地存放地址,且使用'/'分隔 -----------------'
   
   #打开文件并读取
 
     with open(filename_url,'r') as file_obj:
 
         json_data=json.load(file_obj)
       
         print(json_data)

   #JSON数据有两种结构,如图所示,其中包含:

      #对象(object):由 { } 表示,如 {key1:val1, key2:val2}

      #数组(array):由 [ ] 表示,如 [val1, val2, …, valn]

   #获取该json文件的key值
 
     print(json_data.key())
 
     #得出结论:dict_keys(['description','data'])
 
  #如果想要获取某个key值下的值可以使用for循环
 
     eg:for item in json_data['data']:    #循环key值为data的value值,由于data中还有json串,循环中每个item都是一个字符串
          
             print(item['city'])

#从字符串变量读取

     json_str='{--------json字符串---------}'
    
     json_data=json.loads(json_str)   

 

4、Excel文件读操作

#导入包

    import pandas as pd
    
#打开文件并读取
    
    filename_url=' ---------------文件在本地存放地址,且使用'/'分隔 -----------------'
    
    #读取单个工作簿(某一个sheet页)
    
       df_obj=pd.read_excel(filename_url,sheetname='--sheet页名字--')
    
       #获取查看数据类型
    
            print(type(df_obj))#得到数据类型为DataFrame类型
        
        #预览数据
    
            df_obj.head()
    
    #读取多个工作簿
    
       df_data=pd.read_excel(filename_url,sheetname=['sheet1','sheet2']
       
       #获取查看数据类型
       
            print(type(df_data))#得到的数据类型为OrderedDict
        
        #预览数据
           
            df_data['sheet1'].head()
            
            df_data['sheet2'].head()       

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值