自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Numpy数据存取

Numpy数据存取numpy提供了便捷的内部文件存取,将数据存为np专用的npy(二进制格式)或npz(压缩打包格式)格式 npy格式以二进制存储数据的,在二进制文件第一行以文本形式保存了数据的元信息(维度,数据类型),可以用二进制工具查看查看内容 npz文件以压缩打包文件存储,可以用压缩软件解压import numpy as npa = np.array([['张三','李四','王五','赵六'],['11','12','13','14','15']])b = a = np.arang

2021-04-10 11:13:53 1077

原创 Pandas分类,&绘图, &时间序列

Pandas分类categorical data是指分类数据:数据类型为:男女、班级(一班、二班)、省份, 使用赋值法给变量赋值,例如(男=1,女=0),数字1, 0之间没有大小之分,不能认为1是比0大的 numerical data是指数值型数据:收入(1000元,500元),是可以进行比较大小并进行运算的数据。从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,Pandas可以在DataFrame中包含分类数据df = pd.DataF..

2021-04-10 11:11:53 1204 1

原创 pandas数据操作,& 数据排序, & 数据类型运算

字符串方法Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素t = pd.Series(['a_b_c_d','c_d_e',np.nan,'f_g_h'])tt.str.cat(['A','B','C','D'],sep=',') #拼接字符串t.str.split('_') #切分字符串t.str.get(0) #获取指定位置的字符串t.str.replace("_", ".") #替换字符串t.str.pad(10, fillc

2021-04-10 11:00:00 266

原创 Pandas统计分析, 数据存取

pandas数据的基本统计分析和numpy的函数近似dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])dfdf.describe() #快速统计结果df.mean() # 按列求平均值df.mean(1) # 按行求平均值基本统计分析函数.describe()针对0轴(列.

2021-04-10 10:52:57 224 1

原创 Pandas缺失数据处理, 数据规整

Pandas用np.nan代表缺失数据reindex()可以修改索引,会返回一个数据的副本:df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])df1df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])df1df1 = df.reindex(index=dates[0:4], columns=list(df.columns)..

2021-04-10 10:50:08 80

原创 【sed 命令详解】

sed 行文件编辑工具。因为它编辑文件是以行为单位的。命令格式详解命令格式: sed [参数] '<匹配条件> [动作]' [文件名] 注意: 可以通过 sed --help 查看grep的帮助信息参数详解: 参数为空 表示sed的操作效果,实际上不对文件进行编辑 -i 表示对文件进行编辑 注意:mac版本的bash中使用 -i参数,必须在后面单独加个东西: -i ' '匹配条件: 匹配条件分为两种:数...

2020-11-21 13:57:20 1749

原创 【pandas】DataFrame查增改删

DataFrame查增改删查 Read类list/ndarray数据访问方式dates = pd.date_range('20130101',periods=10)datesdf = pd.DataFrame(np.random.randn(10,4),index=dates,columns=['A','B','C','D'])df#索引df['A']df.Adf['A']['2013-01-01']#先列后行df.A['2013-01-01']df[['A','C']]

2020-11-14 14:27:12 150

原创 【pandas】 数据类型-DataFrame

数据类型-DataFrameDataFrame是由多个Series数据列组成的表格数据类型,每行Series值都增加了一个共用的索引 既有行索引,又有列索引 行索引,表明不同行,横向索引,叫index,0轴,axis=0 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1 DataFrame数据类型可视为:二维 带标签 数组 每列值的类型可以不同 基本操作类似Series,依据行列索引操作 常用于表达二维数据,但也可以表达多维数据(Dataframe嵌套,极少用)D

2020-11-14 14:25:48 387

原创 [pandas] 数据类型-Series

数据类型-SeriesSeries数据类型由一组数据和数据相关的索引组成,键 -> 值 Series数据类型可视为:一维 带标签 数组 Series基本操作类似数组和字典Series数据类型的创建首先载入库import numpy as npimport pandas as pdPython list列表创建Seriesa = pd.Series([1,2,3,4]) #默认索引b = pd.Series([1,2,3,4],index=['a','b','c',.

2020-11-14 14:23:36 243

原创 【Pandas】简单介绍

Pandas(panel data & Data Analysis):Python数据分析库。是基于Numpy的,专用于数据分析的Python第三方库,最适用于处理大型结构化表格数据Pandas最初是对冲基金公司开发出来做金融量化数据分析的Python库 Pandas借鉴了R的数据结构 Pandas基于Numpy搭建,支持Numpy中定义的大部分计算 Pandas提供了大量和其他技术交互的接口(比如IO工具 (CSV, XLSX, HDF5, ...),可视化(封装pyplot)...

2020-11-14 14:21:56 281

原创 python下读取csv文件结果转换list

【Linux】Ubuntu16.04环境下git安装与配置Git:本地分支和远程分支建立追踪git branch --set-upstream-to=orign/<远程分支名> <本地分支名>

2020-11-14 13:06:30 2878

原创 拉取线上更新代码到本地 及 提交本地代码到线上的流程

GIT在实际开发中,可能存在master dev分支,我们需要在dev分支下创建至今的分支进行开发操作创建分支: git branch dev创建并切换分支: git checkout -b ziying建本地分支追踪服务器分支:git branch --set-upstream-to=origin/ziying ziying拉取线上更新代码到本地git更新合并代码流程, 1.如果已commit则需要先reset commit 查看log git b...

2020-10-27 14:03:29 814

原创 git工具使用代码管理

Git:本地分支和远程分支建立追踪关系git branch --set-upstream-to=<远程主机名>/<远程分支名> <本地分支名>git branch --set-upstream-to=origin/ziying ziying在多人协同开发中,A在本地开发完成后,将代码推送到远程,这时候B的本地代码的版本就低于远程代码的版本,这时候B该如何从远程拉取最新的代码,并与自己的本地代码合并?1. 查看远程仓库列表git re...

2020-10-27 13:32:14 86

原创 Ubuntu16.04环境  git安装与配置

Ubuntu16.04环境下git安装与配置1.Git安装sudo apt-get install git2.配置git环境git config --global user.name "用户名"git config --global user.email "邮箱"3.生成SSH密钥,输入下面命令后直接回车ssh-keygen -t rsa -C "用户名/邮箱" 公钥的存放位置 ~/.ssh/id_rsa.pub4. 登录GitHub填入client端生成..

2020-10-27 12:37:32 243

原创 python GIL(全局解释器锁)

1. 单线程死循环在VMware虚拟软件中将Ubuntu设置为单核cpu# 主线程死循环,占满cpuwhile True: pass2. 多线程死循环在VMware虚拟软件中将Ubuntu设置为双核cpuimport threading#子线程死循环def test(): while True: passt1 = threading.Thread(t...

2018-04-02 12:56:21 1220

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除