1.引入 pandas
import pandas as pd
2.从csv文档读入数据 read_csv:
In[13],直接读出文档;In[24],读文档时,分列并命名列名
3.删除重复项 drop_duplicates
4.截取字符串slice
slice(star,end)
5.分列 split 及 重新设置Column Name
从csv 文件中读取对应内容,并对某Column进行分列,之后再重新设置Column Name。
6.其他
按条件筛选:
a. dy[dy.comments.between(1000,10000)] #筛选 comments 列 >=1000,并<=10000的项目
b.dy[dy.title.str.contains('台电',na=False)] #筛选title 列包含 “台电” 的项目
c.dy[pd.isnull(dy.title)] # 筛选title 列为 null 的项目
…………