- 博客(6)
- 收藏
- 关注
原创 Pandas系列学习(二):数据读取与输出
平时工作中,主要会涉及到csv、excel和sql等数据的导入与导出比较多。pandas库也内置了相应的函数进行处理读取与输出这些文件。首先,看看pd.read_csv()函数的语法格式如下:1.pd.read_csv()pd.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None...
2019-07-14 09:52:18 2068
原创 Pandas系列学习(一):Pandas入门
介绍Pandas是一套用于Python的快速的,高效的数据分析工具。近年来它的受欢迎程度飙升,对于数据清洗处理与机器学习所必不可少的库。正如Numpy提供了基础的数据类型,Pandas提供了数组的处理操作,并定义了待处理数据的基本架构,以及赋予了一系列处理基于该数据结构的数据处理方法,例如:读取数据 调整索引 使用日期和时间序列 排序,分组,重新排序和一般数据调整 数据缺失值清...
2019-07-13 22:25:00 257
原创 Pandas中apply,applymap以及python自带map的用法与区别
1.apply()Pandas中apply函数的格式为:apply(func, axis=0,raw=False, result_type=None, args=(), **kwds)其中,func可以是匿名函数,应用在DataFrame的行或列上。axis:0或'index':函数应用在DataFrame每列上; 1或'columns':函数应用在Data...
2019-07-13 20:23:35 494 1
原创 Oracle中排序函数的用法之ROW_NUMBER()/RANK()/DENSE_RANK() OVER()的区别
一、ROW_NUMBER()的用法语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)row_number()从1开始,为每一条分组记录返回一个数字,这里的ROW_NUMBER() OVER (ORDER BYcolum DESC) 是先把colum列降序,再为降序以后的每条colum记录返回一个序号。ROW_NUMBE...
2019-06-02 22:50:00 1062
原创 Oracle中的行列转换-行转列
首先建一个表create table chengji(id NUMBER,name VARCHAR2(20),course VARCHAR2(20),score NUMBER); insert into chengji (id, name, course, score)values (1, '张三', '语文', 67);insert into chengji (id, ...
2019-06-02 18:59:13 4476
原创 分类——决策树算法(Python3实现)
决策树算法的核心思想:根据特征以及其对应特征值组成的元组为切点切分样本空间;决策树算法是分类算法中的一种,ID3及C4.5决策树是多叉树。1.熵、条件熵与信息增益 熵(entropy) 在信息论与概率统计中,熵(entropy)是表示随机变量不确定性的度量。X为有限个值的离散随机变量,其概率分布为:...
2019-06-02 11:40:58 1549 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人