python常用的小东西

防止忘记,在此做个记录

目录:

  1.  读取csv
  2. 筛选
  3. 排序
  4. 写入csv(解决中文乱码参数:encoding='utf_8_sig')

1.读取csv

import pandas as pd
file = pd.read_csv(r'D:\projects\PycharmProjects\final_wangwei\final_news_all.csv', usecols=['entity_id', 'post_title','publish_year','publish_month'])

2.根据列值筛选

news=file[((file['publish_year']==2018) & (file['publish_month']>4))|((file['publish_year']==2019) & (file['publish_month']<5))]

3.根据某列值排序(升序)

news=news.sort_values('publish_month',ascending=True)

4.对于pandas.core.frame.DataFrame提取某列,并转换为list

news['entity_id'].values.tolist()
5.根据某列统计
news['publish_month'].value_counts()

6.读取txt,concat

df_empty = pd.DataFrame(columns=['doc'])
data1=pd.read_csv('linshi/5079161.txt',names=["doc"])

df=pd.concat([df_empty,data1,data2,data3,data4],axis=0)  #纵向

7.获取当前时间

import time

 print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))

8.按行创建dataframe

sdp=pd.DataFrame.from_items([('months',months),('shoucangs',shoucangs),('dianzans',dianzans),('pingluns',pingluns)])

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值