自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 大数据案例分析学习笔记1.5(一致性的评价方法)

什么是一致性评价?一致性评价: 指对两个或多个相关的变量进行分析,从而衡量其相关性的密切程度一致性评价——皮尔森相关系数法(pearson)皮尔森相关系数的应用背景:1、用来衡量两个用户之间兴趣的一致性2、用来衡量预测值与真实值之间的相关性3、既适用于离散的,也适用于连续变量的相关分析取值区间为[-1,1]。-1是完全负相关,+1表示完全正相关,0表示没有线性相关一致性评价——C...

2020-02-21 14:56:38 3726

原创 大数据案例分析1.4(回归问题及其性能评价)

回归问题回归: 回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计方法。和分类问题不同,回归通常输出为一个实数数值。二分类的输出通常为若干指定的类别标签回归性能度量方法:平均绝对误差MAE均方差MSElogistic回归损失(二类)简称Log loss或交叉熵损失,常用于哦名家逻辑回归LR和神经网络对于二分类问题:1、假设某样本的真实标签为y(取值为0...

2020-02-21 14:17:47 706

原创 大数据案例分析学习笔记1.3(分类及其性能度量)

分类问题分类问题是有监督学习的一个核心问题,当输出变量取有限个离散值时,预测问题别成为分类问题分类的机器学习的两大阶段(1)从训练数据中学习得到一个分类决策函数或分类模型,称为分类器(classifier);(2)利用学习得到的分类器对新的输入样本进行类别预测两类分类问题与多类分类问题。多类分类问题也可以转化为两类分类问题解决,如采用一对其余的方法,将其中一个类标记为正类。然后将剩余的其他...

2020-02-21 13:30:14 344

原创 大数据案例分析学习笔记1.2(数据集及其拆分)

鸢尾花数据集类别标签的ground truth与gold standard

2020-02-21 12:51:14 899

原创 大数据案例分析学习笔记1.1(深度学习的引出)

什么是机器学习?(Machine learning)机器学习:是对研究问题进行 模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科从简单线性分类器到深度学习(一)从简单线性分类器到深度学习(二)深度学习网络中往往包含多个中间层(隐藏层)且网络结构要更复杂一些什么是深度学习?(Deep learning)一种实现机器学习的技术,是机器学习重...

2020-02-20 17:36:28 184

原创 seaborn.PairGrid()

seaborn.pairgrid():将各变量间的关系成对绘制参数:data:DataFrame格式hue:将绘图的不同面映射为不同的颜色palette:调色板vars:使用data中的变量,否则使用一个数值型数据类型的每一列。height标量,可选,每个刻面的高度(以英寸为单位)aspect:标量,可选,aspect 和 height 的乘积得出每个刻面的宽度(以英寸为单位)de...

2019-12-01 01:28:10 3443

原创 pyecharts绘制日历图、漏斗图、仪表盘、水滴图

日历图import datetimeimport randomfrom pyecharts.charts import Calendarfrom pyecharts import options as opts#Calendar-2017年微信步数情况def calendar_base(): begin = datetime.date(2017, 1, 1) end ...

2019-11-17 23:06:25 1475

原创 pyecharts定制主题

pyecharts内置提供了10+种不同的风格,另外也提供了便捷的定制主题的方法准备工作from pyecharts import options as optsfrom pyecharts.charts import Barfrom pyecharts.globals import ThemeTypex=['衬衫','羊毛衫','雪纺衫','裤子','高跟鞋','袜子']y1=[...

2019-11-17 17:50:14 3229 1

原创 pyecharts库绘制:条形图、折线图、饼图、环形图、散点图及相应参数设置

import pyechartspyecharts.__version__ #版本检查import pyecharts.charts as pyecx=['甲','乙','丙']y=[300,800,600]bar=pyec.Bar()bar.add_xaxis(x)bar.add_yaxis(series_name='A',yaxis_data=y)bar.render_no...

2019-11-03 00:49:40 4275

原创 seaborn库:线图、直方图、密度图、连接图、热力图、线性回归图、分面网格图绘制

准备工作import matplotlib.pyplot as plt # 导入模块%matplotlib inline# 在nootbook中显示所绘图像import numpy as npimport pandas as pdimport seaborn as snsplt.rcParams['axes.unicode_minus'] = False#用来正常显示负号sns...

2019-11-03 00:05:16 1855

原创 seaborn绘图02

准备工作import matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlineimport numpy as npimport pandas as pdplt.rcParams['axes.unicode_minus']=Falsesns.set_style('darkgrid',{font.sans-serif...

2019-10-20 23:55:26 157

原创 numpy数组操作(反转和连接)

numpy数组的操作反转操作:numpy.reshape()numpy.ndarray.flatten (numpy.flat)numpy.ndarray.T()连接操作:numpy.concatenete()numpy.stack()numpy.vstack()numpy.reshape():import numpy as npa = np.array([[1,2...

2019-10-13 23:55:18 5911

原创 seaborn绘图(整体样式与调色板)

一、seaborn绘图官网seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图seaborn是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,如果需要复杂的自定义图形,还需要matplotlibmatplotlib库存在的问题:matplotlib绘制的图表不漂亮...

2019-10-13 16:05:53 1189 1

原创 matplotlib绘图3

import matplotlib.pyplot as plt%matplotlib inlineplt.rcParams['font.sans-serif'] = ['simHei']#用来正常显示中文标签plt. rcParams['axes,unicode_minus'] = False#用来正常显示负号import numpy as np饼图 plt.piex = [1,...

2019-10-03 21:27:04 174

原创 Matplotlib绘图2

plt.gcf()与plt.gca()import matplotlib.pyplot as plt%matplotlib inlineimport numpy as npx = np.linspace(0.05,10,1000)y = np.sin(x)plt.plot(x,y)当先的图表和子图可以使用plt.gcf()和plt.gca()获得,分别表示Get Current...

2019-09-22 15:40:00 223

转载 matplotlib中颜色及线条控制

matplotlib中颜色及线条控制

2019-09-14 21:19:58 86

原创 Matplotlib绘图

基于Matplotlib模块的绘图matplotlib官网matplotlib是python最著名的绘图库之一,提供了一整套和MATLAB相似的命令API,既适合交互式地进行制图,也可以作为绘图控件方便地嵌入GUI应用程序中matplotlib的pyplot字库提供了和MATLAB类似的绘图API,方便用户快速绘制2D图表,包括直方图、饼图、散点图等matplotlib配合nu...

2019-09-14 21:03:43 149 1

原创 Numpy基础知识

numpy简介Numpy 是一个专门用于矩阵化运算、科学计算的开源Python库,Numpy将Python相当于变成一种免费的更强大的Matlab系统优势:1、强大的 ndarray 多维数组结构2、成熟的函数库3、用于整合C/C++和Fortran代码的工具包4、实用的线性代数、傅里叶变换和随机数模块5、Numpy 和稀疏矩阵运算包scipy 配合使用非常方便numpy adar...

2019-09-13 16:23:25 196

原创 NPL自然语言处理

一、自然语言处理自然语言处理(natural language processing,NLP)也称自然语言理解(natural language understanding,NLU),从人工智能研发的一开始,它就作为这一学科的重要研究内容探索人类理解自然语言这一智能行为的基本方法。二、自然语言处理研究的内容自然语言处理研究的内容非常广泛,根据其应用目的的不同,大致列举了如下一些研究方向:(...

2019-09-08 15:56:34 10436 1

原创 面向对象编程三大特征——封装、继承、多态

一、封装根据需要将属性和方法封装到一个抽象的类中使用时,只需要按照自己的需求去调用,不必了解实现的细节封装有两方面的含义:1、将数据(属性)和行为(方法)包装到类对象中。在方法内部对属性进行操作,在类对象的外部调用方法,无需关心方法内部的具体实现细节,从而隔离了复杂度。2、在类对象的内部通过访问控制把某些属性和方法隐藏起来,不允许在类对象的外部直接访问,而是在内对象的内部提供公开的接口方...

2019-05-20 20:31:09 251

原创 文件与数据格式化

一、文件的类型:1.文件时数据的抽象和集合文件是存储在辅助存储器上的数据序列文件时数据存储的一种形式文件时数据存储的一种形式2.文本文件和二进制文件文本文件和二进制文件值是文件的展示方式本质上,所有文件都是二进制形式存储形式上,所有文件采用两种方式展示3.文本文件由单一特定编码组成的文件,如UTF-8编码由于存在编码,也被看成是存储着的长字符串适用于例如:.txt...

2019-05-02 14:09:45 184

原创 python模块和包

一、模块与包python中的模块包括系统模块、第三方模块和用户自定义的模块。他们实质上是以 .py为扩展名的python文件。通过导入模块,可以使用该模块中的变量函数和类等。二、模块化程序设计的概念如果程序中包含多个可以复用的函数或类,则通常把相关的函数和类分组包含在单独的模块(module)中。这些提供计算功能的模块称之为模块(或函数模块),导入并使用这些模块的程序,则称之为客户端...

2019-05-02 09:56:51 281

原创 python函数

一、函数的定义:语法:def <函数名>(<参数列表>):<函数体>return <返回值列表>二、函数的调用四个步骤:1、调用程序在调用出暂停执行2、在调用时将实参复制给函数的形参3、执行函数体语句4、函数调用结束给出返回值,程序回到调用前暂停处继续执行三、函数的参数传递位置参数 ---->关键字参数---->可...

2019-04-13 18:38:12 3785 1

原创 标准库time、datetime、calendar、random的使用

1. 时间戳: 格林威治时间1970年01月01日00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。2.元组struct_time: 日期、时间是包含许多变量的,所以在Python中定义了一个元组struct_time将所有这些变量组合在一起,包括:4位数年、月、日、小时、分钟、秒等。所有变量及要求如下:序号属性值0tm_year(4位...

2019-04-11 22:34:09 141

原创 python列表常用方法

一、列表介绍列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现列表是可变的数据类型,即这种类型是可以被改变的,且列表是可以嵌套的二、列表操作创建列表把逗号分隔的不同的数据项使用方括号括起来 list = ['abc',123,'def']访问列表使用下标索引来访问列表中的值,同样你也可以使用方括号的形式截取字符 >>>...

2019-03-30 23:34:56 178

原创 python字符串方法详解

去掉空格和特殊字符:>>> s = ' abc\n '>>> s.strip() #去掉空格和换行符'abc'>>> s.lstrip() #去掉左侧的空格和换行符'abc\n '>>> s.rstrip() #去掉右侧的空格和换行符' abc'>>> s1 = 'a...

2019-03-22 23:26:53 112

原创 Python内置函数功能汇总

内置函数1. abs(x) : 返回x的绝对值**&amp;amp;gt;&amp;amp;gt;&amp;amp;gt; abs(-1.3)1.32. all(iterale) : 判断可迭代参数iterable中所有元素是否没有0、空、False是返回True,不是返回False&amp;amp;gt;&amp;amp;gt;&amp;amp;gt; all(['a','b','c']) True&amp;

2019-03-16 19:42:04 123

原创 math标准库函数功能汇总

math标准库 #引入math库 import mathmath包定义了两个常数:math.e常数emath.pi圆周率运算函数:math.ceil(x) : 得到大于或等于x的最小整数&gt;&gt;&gt; import math&gt;&gt;&gt; math.ceil(9.1)10math.floor(x) :得到小于或等于x的...

2019-03-14 16:53:28 476

原创 Jupyter Notebook 与Markdown知识点汇总

Jupyter Notebook 与Markdown知识点汇总

2019-03-13 23:08:29 130

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除