自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 python-word操作

#安装包python-docx,但是import docx#Document:文档,Paragraph:段落,run:文字块import docx---------------------------------------------------------------------------ModuleNotFoundError Traceback (most recent call last)<ipython-input-1-1d91

2020-10-12 19:20:28 119

原创 python -时间序列数据分析

#时间序列分类#1)时间戳 timestamp,特定时刻#2)固定周期(period),某月或某年,可以在时间操作中设置间隔的周期#3)时间间隔(interval),由起始时间戳或结束时间戳表示#字符串和datetime转换datatime -> strstr(datetime_obj)datetime.strftime()str->datetime的形式有以下几种方法datetime.strptime()需要指定时间表示的形式dateutil.parser.parse(

2020-10-12 19:19:38 438

原创 pandas- loc 5种查询数据

#csv,tsv,txt均用pd.read_csv#excel,用pd.read_excel#mysql 用pd.read_sqlimport pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')df = pd.read_csv('loc test.csv',encoding='gbk')df 订单号 客户姓名

2020-10-12 19:18:59 749 1

原创 pandas 对缺失值的处理--数据清洗

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')df = pd.read_csv('california_cities.csv')df.head() Unnamed: 0 city latd longd elevation_m elevation_ft

2020-10-12 19:18:37 261

原创 pandas-字符串处理

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis')df = pd.read_excel('pandas_multiindex.xls')df.head(2) 日期 收盘 开盘 高 低 交易量 涨跌幅 公司 0

2020-10-12 19:17:56 270

原创 pandas的axis参数

'''axis = 0 或 index:如果是单行操作,就是指的是某一行;如果是聚合操作,指的是跨行cross rowsaxis = 1 或 columns:如果是单列操作,就指的是某一列;如果是聚合操作,指的是跨列cross columns按哪个axis,就是这个axis要动起来(类似被for遍历),其他的axis保持不动 '''import pandas as pd import numpy as npdf = pd.DataFrame(np.arange(12).reshape(3,

2020-10-12 19:17:17 272

原创 pandas的索引index的用途

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')df = pd.read_csv('03_Alcohol_Consumption.csv')df.head() country beer_servings spirit_servings wine_servings total_l

2020-10-12 19:16:31 185

原创 pandas实现DataFrame的Merge功能

#Merge :按照key将不同的表进行合并#语法:pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)right : DataFrame or n

2020-10-12 19:15:49 835

原创 pandas实现数据的合并concat--未完

#使用场景批量合并相同格式的excel,或者给DataFrame添加行,给DataFrame添加列#可以使用某种合并方式(inner/outer);沿着某个轴向(axis=0/1);把多个pandas对象(DataFrame/Series)合并成一个;concat相当于堆积,语法:pandas.concat(objs,axis=0,join='outer',ignore_index=False)objs:一个列表,内容可以是DataFrame或者Series,可以混合 join:合并的时候索引的方

2020-10-12 19:15:12 159

原创 pandas 批量拆分excel,批量合并excel

import os import pandas as pd import numpy as npos.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')if not os.path.exists("test_concat"): os.mkdir('test_concat')#创建文件夹df_02 = pd.read_csv('05_cars2.csv')df_02.head()

2020-10-12 19:14:48 360

原创 pandas 数据转换函数map、apply、applymap

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis')df = pd.read_excel('pandas_multiindex.xls')df.head() 日期 收盘 开盘 高 低 交易量 涨跌幅 公司 0

2020-09-29 21:34:53 723

原创 pandas 将DataFrame中的数据转换数据形式

import pandas as pd file_path = r"C:\Users\Hans\Desktop\data_analysis\test_data\Beijing_2014.csv"df = pd.read_csv(file_path)df.head() Date Temperature(Celsius)(high) Temperature(Celsius)(avg) Temperature(Celsiu

2020-09-29 21:34:29 1976

原创 pandas怎么对groupby之后的每个分组应用apply函数

#(1)怎样对数值列按照分组的归一化#(2)怎样取每个分组的TOP N数据‘’’X的归一化:X(normalized) = (X当前值-最小值)/(X最大值-X最小值)‘’’import pandas as pd import os os.chdir(r"C:\Users\Hans\Desktop\data_analysis\test_data\movie")ratings = pd.read_csv("ratings.dat",sep = "::",engine = "python",n

2020-09-29 21:33:15 2125

原创 pandas的stack和pivot实现数据透视

import pandas as pd import numpy as npimport os %matplotlib inlineos.chdir(r"C:\Users\Hans\Desktop\data_analysis\test_data\movie")df = pd.read_csv("ratings.dat",sep = "::",engine="python",header=None,names=['UserID','MoiveID','Rating','Timestamp'])##

2020-09-29 21:32:23 322

原创 pandas 对日期进行的处理

import pandas as pd import osos.chdir(r"C:\Users\Hans\Desktop\data_analysis\test_data")df = pd.read_csv("Beijing_2014-02.csv")df.head() Date Temperature(Celsius)(avg) Dew Point(Celsius)(avg) Humidity(%)(avg)

2020-09-29 21:31:55 171

原创 pandas处理日期缺失

#两种方法实现'''1)DataFrame.reindex:调整dataframe的索引以适应新的索引2) DataFrame.resample,可以对时间序列重新采样,支持补充缺失值'''import pandas as pd import os%matplotlib inlinedf = pd.DataFrame({ "pdate":['2019-12-01','2019-12-02','2019-12-04','2019-12-05'], 'pv':[100,200,

2020-09-29 21:31:20 2595 2

原创 pandas 调整列的位置(或顺序)

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')df = pd.read_csv('ChinaBank.csv')df.head() Unnamed: 0 Date Open High Low Close Volume

2020-09-29 21:30:43 16524 2

原创 pandas 同时加条件筛选和赋值

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis\test_data')df = pd.read_csv('reslut.csv',encoding='gbk')df.head() 日期 收盘 开盘 高 低 百分比变化量 0 2018

2020-09-29 21:30:05 3305

原创 pandas 单列排序&多列排序

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis')df = pd.read_excel('pandas_multiindex.xls')df.head() 日期 收盘 开盘 高 低 交易量 涨跌幅 公司 0

2020-09-29 21:29:38 982

原创 pandas 分层索引(多级索引)

import pandas as pd import os os.chdir(r'C:\Users\Hans\Desktop\data_analysis')df = pd.read_excel('pandas_multiindex.xls')df.head() 日期 收盘 开盘 高 低 交易量 涨跌幅 公司 0

2020-09-29 21:28:52 2135 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除