![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析基础知识
文章平均质量分 69
Yidian_
心之所向为时不晚,希望志同道合的我们早日相加。
展开
-
python写入csv文件(print返回结果输出到文件)
1.不用手动创建result.csv,系统会自己创建f = open("result.csv","w")#写入,分块读取数据集时用“a”追加写入 # #代码循环体 # # print(df,file=f)f.close2.使用.to_csv()#代#码df.to_csv('result.csv',header=None)...原创 2020-03-01 23:54:45 · 8815 阅读 · 5 评论 -
查看数据结构,spyder打开csv文件,数据频数排序统计,基本索引切片,筛选数据集某列中含有某个值的所有行数据
拿到数据集第一件事,查看数据结构print(df.dtypes)#数据集的数据结构print(df.index)#查看索引类型df['C'] =df['C'].astype(int)#强制类型转换print('表中元素个数,维度,形状:\n',df.size,df.ndim,df.shape)print('表单长度:\n',len(df))#显示表单长度print('没有列索引名称的表...原创 2020-03-01 23:47:13 · 3233 阅读 · 0 评论 -
python新增相同列,设置日期索引,重定索引,选取时间段内数据
pandas新增一列相同值 df['C1'] = df['C']#复制一列C,因为想统计2015年的数据,但需要显示年月日 df['C1'] = pd.to_datetime(df['C1']) # 将object类型时间转化为datetime64[ns] df['C1'] = df['C1'].map(lambda x: x.strftime('%Y')) # 设置显示‘年’ df[...原创 2020-03-01 23:40:55 · 1382 阅读 · 0 评论 -
python处理大型csv文件——pandas数据分析(含有毫秒的时间类型转换,根据需求显示年月日,显示全部行和列,某列频数统计)
打开一个数据集,df=pd.read_csv(‘filename.csv’) #数据集较大时候用分块读取数据方法chunksize=1000,iterator=True数据集内容为:A B C D0 ID_1 ID_2 2015-1...原创 2020-02-28 19:36:59 · 1582 阅读 · 0 评论 -
python合并两个csv文件(纯合并,不是按照关键字连接)
import osimport pandas as pdimport globcsv_list = glob.glob(’*.csv’) #查看同文件夹下的csv文件数print(u’共发现%s个CSV文件’% len(csv_list))print(u’正在处理…’)for i in csv_list: #循环读取同文件夹下的csv文件fr = open(i,‘rb’).read(...原创 2020-02-20 20:57:08 · 1314 阅读 · 0 评论 -
pandas基础
Series:一维数据+index;DataFrame:二维、多维数据+index,colmuns;#axis=0纵向,axis=1横向;#标量值创建series一维数据结构‘’‘s=pd.Series(25,index=[‘1’,‘2’,‘3’])print(s)’’’#字典创建‘’‘d=pd.Series({‘a’:4,‘b’:5,‘c’:6},index=None)print...原创 2020-02-14 22:27:59 · 149 阅读 · 0 评论 -
pycharm配置python环境、pycharm配置Anaconda环境、pycharm代码字体调节
之前没有按顺序安装,出了很多错;记录一下,不会的时候干啥 啥麻烦,谢谢那些发布解决方案的人啊,所以我自己也记录一下。一:python安装,查看Python安装路径1.官网下载python 3.x版本,百度安装步骤,有图解。2.在本台电脑-属性,配置环境变量:添加python安装路径到PATH(细心一点,不要使用中文符号,多余空格);3.快捷键win+R打开"运行",输入CMD(cmd)进入...原创 2020-02-10 18:39:27 · 485 阅读 · 0 评论