自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Matplotlib的figure对象和subplot对象

**Matplotlib的figure对象和subplot对象**MatplotlibMatplotlib:是一个用于创建出版质量图表的桌面绘图包import matplotlib.pyplot as pltpyplot模块包含Matplotlib API函数figureMatplotlib的图像均位于figure对象中创建figur...

2019-07-24 12:21:22 3844 1

原创 数据分析

数据分析基本概念明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现常用的收集途径: 公开信息,外部数据库,自有数据库,调查问卷,客户数据数据清洗: 可读性,完整性,唯一性,权威性及合法性常见的数据类型1,类别型数据 (1)取值种类 (2)每类取值的分布2,数值型变量 (1)极值和分位点 (2)均值和标准差 (3)变量间相关性3,通用...

2019-07-18 10:59:23 184

原创 MYSQL(函数,存储体,循环)

1、函数字符串函数ascii(str)返回字符串str的第一个字符的ascii值(str是空串时返回0)mysql> select ascii(‘2’);  -> 50mysql> select ascii(2);  -> 50mysql> select ascii(‘dete’);  -> 100ord(str)如果字符串str句首是单字...

2019-12-01 22:44:53 676

原创 数据结构(顺序存储和链表存储部分)

1,线性表1. 线性表的定义线性表(linear list)是n(n≥0)个数据元素a1,a2,…an组成的有限序列。其中n 称为数据元素的个数或线性表的长度,当n=0时称为空表,n>0时称为非空表。通常将非空的线性表记为(a1,a2,…,an),其中的数据元素ai(1≤i≤n)是一个抽象的符号,其具体含义在不同情况下是不同的,即它的数据类型可以根据具体情况而定,我们将它的类型设定为el...

2019-11-30 23:28:43 599

原创 数据分析的三个机器学习算法

数据分析的三个机器学习算法knn算法(邻近算法)采用测量不同特征值之间的距离方法进行分类优点:精度高,对异常值不敏感,无数据输入假定。缺点:时间复杂度高,空间复杂度高。1、当样本不平衡时,比如一个类的样本容量很大,其他类的样本容量很小,输入一个样本的时候,K个临近值中大多数都是大样本容量的那个类,这时可能就会导致分类错误。改进方法是对K临近点进行加权,也就是距离近的点的权值大,距离远的点...

2019-09-26 20:20:33 1497

原创 数据加载,存储与文件格式(非完整版)

读取文本格式的数据pandas提供了一些用于将表格型数据读取为DataFrame对象的函数其中read_csv和read_table用的比较多pandas中的解析函数函数说明read_csv从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号read_table从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符(“\t”)...

2019-08-30 23:17:58 197

原创 python推导式

列表推导式写一个列表:squares = []for x in range(10):squares.append(x2)print(squares)用推导式优化后:squares = []squares = [x2 for x in range(10)]或者squar = map(lambda x:x2,range(10))注:第一个参数function是一个函数,第二个参...

2019-07-18 19:36:39 132

原创 数据分析简单知识点(numpy)

数据分析基本概念明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现常用的收集途径:公开信息,外部数据库,自有数据库,调查问卷,客户数据数据清洗:可读性,完整性,唯一性,权威性及合法性常见的数据类型1,类别型数据(1)取值种类(2)每类取值的分布2,数值型变量(1)极值和分位点(2)均值和标准差(3)变量间相关性3,通用数据描述(1)缺失值(2)重复性  pyth...

2019-07-11 00:25:31 151

原创 python推导式

列表推导式写一个列表:squares = []for x in range(10):squares.append(x2)print(squares)用推导式优化后:squares = []squares = [x2 for x in range(10)]或者squar = map(lambda x:x**2,range(10))注:第一个参数function是一个函数,第二...

2019-07-11 00:10:04 282 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除