自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

汪雯琦的博客

Python全栈(Python基础+进阶+Linux+数据库+Web+数据挖掘+大数据+人工智能+Go)

  • 博客(196)
  • 资源 (6)
  • 收藏
  • 关注

原创 Matplotlib画饼图不圆怎么办,不是标准圆怎么办

# 将横、纵坐标轴标准化处理,确保饼图是一个正圆,否则为椭圆plt.axes(aspect='equal')

2020-02-29 23:25:43 3084 1

原创 Matplotlib画图中中文乱码和坐标轴负号的代码处理

# 中文乱码和坐标轴负号的处理plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']plt.rcParams['axes.unicode_minus'] = False

2020-02-29 23:24:29 581 1

原创 Python中两个斜杠//是什么运算?

Python中两个斜杠是什么运算?Python中两个斜杠即双斜杠(//)表示地板除,即先做除法(/),然后向下取整(floor)。至少有一方是float型时,结果为float型;两个数都是int型时,结果为int型。另外,地板除 floor(x) 表示不大于x的最大整数,因此不是取整数部分,如 x 为负数时:...

2020-02-29 23:01:59 37826 1

原创 机器学习之Pandas:Pandas介绍、基本数据操作、DataFrame运算、Pandas画图、文件读取与处、缺失值处理、数据离散化、合并、交叉表和透视表、分组与聚合、案例(超长篇,建议收藏慢慢看)

文章目录Pandas学习目标1Pandas介绍学习目标1 Pandas介绍2 为什么使用Pandas3 案例:问题:如何让数据更有意义的显示?处理刚才的股票数据给股票涨跌幅数据增加行列索引,显示效果更佳4 DataFrame4.1 DataFrame结构4.2 DatatFrame的属性4.3 DatatFrame索引的设置**4.3.1修改行列索引值**4.3.2 重设索引4.3.3 以某列值设...

2020-02-29 22:00:49 2307

原创 机器学习之Numpy:Numpy介绍、N维数组-ndarray、基本操作、ndarray运算、数学矩阵、数组间运算(超长篇,建议收藏慢慢看)

文章目录Numpy学习目标4.1 Numpy优势学习目标1 Numpy介绍2 ndarray介绍3 ndarray与Python原生list运算效率对比4 ndarray的优势4.1 内存块风格4.2 ndarray支持并行化运算(向量化运算)4.3 效率远高于纯Python代码5 小结4.2 N维数组-ndarray学习目标1 ndarray的属性2 ndarray的形状3 ndarray的类型...

2020-02-29 21:36:42 944

原创 解决报错:AttributeError: 'AxesSubplot' object has no attribute 'set_xtickslabels'

文章目录源代码报错解决源代码# 需求:多个坐标系# 创建画布的时候要修改了# 用subplots# 参数nrows多少行,我们现在需要一行两列nrows=1# 参数ncols多少列,我们现在需要一行两列你cols=2# 参数figsize是画布大小我们设置为figsize=(20,8)# dpi# plt.subplots(nrows=1,ncols=2,figsize = (2...

2020-02-29 14:19:13 55808 6

原创 Matplotlib添加图例时解决报错:No handles with labels found to put in legend.

文章目录源代码报错原因解决源代码# 需求:再添加一个城市的温度变化#导入工具import matplotlib.pyplot as pltimport random#创建画布plt.figure(figsize=(20,8),dpi = 80)#绘制图像,画出安徽省宣城市泾县11点到12点1小时内每分钟的温度变化折线图,#温度范围在15度~18度(随机产生)x = ran...

2020-02-29 12:12:49 6799

原创 机器学习之朴素贝叶斯(三):哪些词汇经常出现、词云的制作

文章目录抽取数据准备词云库LDA主题模型分类数据及代码下载:https://github.com/w1449550206/Word-cloud-production-based-on-Naive-Bayes.git#词云 词云中不要出现太多的词语import numpy as npimport pandas as pdimport jieba as jb#文本中本来是没有特征 ...

2020-02-28 20:35:18 660 2

原创 基于Python的拼写检查器(附详细代码和注释)

原始数据:https://github.com/w1449550206/CSDN-Data.git代码:import re, collections #查找每一个单词,返回一个列表def words(text): return re.findall('[a-z]+', text.lower()) def train(features): #为字典提供默认的值 ...

2020-02-28 20:12:41 1680 1

原创 CSDN的markdown编辑器的语法:字体的样式、大小、颜色怎么调节?建议收藏,让你的博客更漂亮

   Markdown是一种可以使用普通文本编辑器编写的标记语言,通过类似HTML的标记语法,它可以使普通文本内容具有一定的格式。但是它本身是不支持修改字体、字号与颜色等功能的!   CSDN-markdown编辑器是其衍生版本,扩展了Markdown的功能(如表格、脚注、内嵌HTML等等)!对,就是内嵌HTML,接下来要讲的功能就需要使用内嵌HTML的方法来实现。首行缩进&emsp...

2020-02-28 16:55:55 1997 1

原创 机器学习之朴素贝叶斯(二):朴素贝叶斯算法案例——新闻分类

朴素贝叶斯算法案例文章目录朴素贝叶斯算法案例朴素贝叶斯案例流程代码朴素贝叶斯算法总结sklearn20类新闻分类20个新闻组数据集包含20个主题的18000个新闻组帖子朴素贝叶斯案例流程1、加载20类新闻数据,并进行分割2、生成文章特征词3、朴素贝叶斯estimator流程进行预估代码from sklearn.datasets import load_iris, fetch_...

2020-02-28 15:25:33 1736 1

原创 机器学习之朴素贝叶斯(一):朴素贝叶斯的介绍、概率基础(拉普拉斯平滑)、sklearn朴素贝叶斯实现API、朴素贝叶斯分类的优缺点、文本的特征工程

朴素贝叶斯文章目录朴素贝叶斯一、介绍1.1 文本分类的应用词云的例子垃圾邮件分类文章类别的概率二、概率基础2.1 概率例题2.2 联合概率和条件概率2.3 朴素贝叶斯-贝叶斯公式2.4 概率统计词频2.5 拉普拉斯平滑三、sklearn朴素贝叶斯实现API四、朴素贝叶斯分类的优缺点五、文本特征工程5.1 文本分割,单词提取(1)英文(2)中文5.2 词数统计5.3 TFIDF(重要程度分析)5....

2020-02-28 14:42:58 1297

原创 机器学习之逻辑回归(四):逻辑回归(分类模型)如何评估?——精准率、召回率、F1-score、分类评估报告、绘制ROC曲线、计算AUC指标

逻辑回归需要掌握的知识点知道逻辑回归的损失函数知道逻辑回归的优化方法知道sigmoid函数知道逻辑回归的应用场景应用LogisticRegression实现逻辑回归预测知道精确率、召回率指标的区别知道如何解决样本不均衡情况下的评估了解ROC曲线的意义说明AUC指标大小应用classification_report实现精确率、召回率计算应用roc_auc_score实现指标计...

2020-02-27 23:32:32 4722

原创 求AUC报错ValueError: Data is not binary and pos_label is not specified或continuous format is not support

运行roc_auc_score(y_true=y_test, y_score=y_predict)报错ValueError: Data is not binary and pos_label is not specified出错案例:import numpy as npfrom sklearn.metrics import roc_auc_scorey_true = np.array([...

2020-02-27 22:58:35 5723 2

原创 LeetCode力扣刷题数据库(185):部门工资前三高的所有员工

文章目录题目分析解答相关企业半年内半年~1年1年~2年题目Employee 表包含所有员工信息,每个员工有其对应的工号 Id,姓名 Name,工资 Salary 和部门编号 DepartmentId 。Department 表包含公司所有部门的信息。编写一个 SQL 查询,找出每个部门获得前三高工资的所有员工。例如,根据上述给定的表,查询结果应返回:解释:IT 部门中,Max 获...

2020-02-27 15:53:21 2233

原创 机器学习之逻辑回归(三):基于逻辑回归的癌症预测案例——【癌症分类预测-良/恶性乳腺癌肿瘤预测】

逻辑回归需要掌握的知识点知道逻辑回归的损失函数知道逻辑回归的优化方法知道sigmoid函数知道逻辑回归的应用场景应用LogisticRegression实现逻辑回归预测知道精确率、召回率指标的区别知道如何解决样本不均衡情况下的评估了解ROC曲线的意义说明AUC指标大小应用classification_report实现精确率、召回率计算应用roc_auc_score实现指标计...

2020-02-27 15:17:07 11394 1

原创 机器学习之逻辑回归(二):逻辑回归的API调用——sklearn.linear_model.LogisticRegression中参数分别是什么意思

逻辑回归需要掌握的知识点知道逻辑回归的损失函数知道逻辑回归的优化方法知道sigmoid函数知道逻辑回归的应用场景应用LogisticRegression实现逻辑回归预测知道精确率、召回率指标的区别知道如何解决样本不均衡情况下的评估了解ROC曲线的意义说明AUC指标大小应用classification_report实现精确率、召回率计算应用roc_auc_score实现指标计...

2020-02-27 13:32:56 1583

原创 机器学习之逻辑回归(一):逻辑回归的原理、模型、激活函数的使用、损失函数、优化方法(附手写案例)

逻辑回归需要掌握的知识点知道逻辑回归的损失函数知道逻辑回归的优化方法知道sigmoid函数知道逻辑回归的应用场景应用LogisticRegression实现逻辑回归预测知道精确率、召回率指标的区别知道如何解决样本不均衡情况下的评估了解ROC曲线的意义说明AUC指标大小应用classification_report实现精确率、召回率计算应用roc_auc_score实现指标计...

2020-02-27 11:24:34 4013

原创 Python的Matplotlib简易教程(速查详细版)——非常全,目录清晰,建议收藏

文章目录学完本文,您会收获些什么?一、Matplotlib之HelloWorld学完本节,您会收获些什么?1 什么是Matplotlib2 为什么要学习Matplotlib3 实现一个简单的Matplotlib画图4 认识Matplotlib图像结构(拓展,了解)5 Matplotlib三层结构(拓展,了解)5.1 容器层5.2 辅助显示层5.3 图像层6 小结二、折线图(plot)与基础绘图功能...

2020-02-26 23:57:47 6592 5

原创 解决matplotlib显示不了中文的问题(适用于linux、windows、mac)

中文显示问题解决下载中文字体(黑体,看准系统版本)下载 SimHei 字体(或者其他的支持中文显示的字体也行)安装字体linux下:拷贝字体到 usr/share/fonts 下:sudo cp ~/SimHei.ttf /usr/share/fonts/SimHei.ttfwindows和mac下:双击安装删除~/.matplotlib中的缓存文件cd ...

2020-02-26 23:51:48 875

原创 Jupyter Notebook怎么安装jupyter_contrib_nbextensions库:自动补全代码功能+pep8+字体大小+代码行号+拼写检查+目录索引+代码自动补全

Jupyter Notebook中自动补全代码等相关功能拓展(安装jupyter_contrib_nbextensions库)文章目录Jupyter Notebook中自动补全代码等相关功能拓展(安装jupyter_contrib_nbextensions库)效果展示:安装jupyter_contrib_nbextensions库然后执行重启jupyter notebook勾选需要的功能部分功能...

2020-02-26 22:39:54 5477 1

原创 Jupyter Notebook使用查询手册(详细版):基本操作+鼠标操作+快捷键操作+markdown演示+Jupyter notebook extensions 扩展插件的安装

Jupyter Notebook使用文章目录Jupyter Notebook使用1 Jupyter Notebook介绍2 为什么使用Jupyter Notebook?3 Jupyter Notebook的使用-helloworld3.1 界面启动、创建文件3.2 cell操作3.2.1 鼠标操作3.2.2 快捷键操作3.3 markdown演示4 【拓展】 —— Jupyter Noteboo...

2020-02-26 22:35:41 1438

原创 机器学习——Azure机器学习模型在线搭建实验原理+详细操作步骤+分析(以UCI数据库的数据为例)

Azure机器学习模型搭建实验本文数据及文档地址:https://github.com/w1449550206/Azure-machine-learning-model-building-experiment.git文章目录Azure机器学习模型搭建实验机器学习工作流程总结登录方法Azure平台简介Azure机器学习实验详细操作步骤Azure机器学习实验一、项目背景【项目简介】【项目涉及知识点...

2020-02-26 22:00:54 7430

原创 机器学习——模型的评估方法速查手册(RMSE+RSE+MAE+RAE+R^2)

模型评估文章目录模型评估学习目标1 分类模型评估2 回归模型评估均方根误差(Root Mean Squared Error,RMSE)相对平方误差(Relative Squared Error,RSE)平均绝对误差(Mean Absolute Error,MAE)相对绝对误差(Relative Absolute Error,RAE)决定系数 (Coefficient of Determinati...

2020-02-26 20:12:17 11254 4

原创 机器学习线性回归(七):sklearn之模型保存和加载(附房价预测案例源代码)

模型的保存和加载文章源代码下载地址:波士顿房价岭回归正则化预测代码实现文章目录模型的保存和加载1.sklearn模型的保存和加载API2.线性回归的模型保存加载案例2.1保存模型2.2加载模型2.3结果1.sklearn模型的保存和加载APIfrom sklearn.externals import joblib- 保存:joblib.dump(estimator, 'test.pkl...

2020-02-26 16:04:09 2625

原创 避免线性回归的过拟合(二):线性回归的改进——岭回归(附波士顿房价预测案例源代码)

线性回归的改进-岭回归文章源代码下载地址:波士顿房价岭回归正则化预测代码实现文章目录线性回归的改进-岭回归1.API2.观察正则化程度的变化,对结果的影响?3.波士顿房价正则化预测代码4.结果1.APIsklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True,solver=“auto”, normalize=False)具有l2...

2020-02-26 15:00:59 1106

原创 避免线性回归的过拟合(一):正则化线性模型3个(岭回归+Lasso回归+弹性网络)

正则化线性模型文章目录正则化线性模型1.Ridge Regression (岭回归,又名 Tikhonov regularization)2.Lasso回归3.弹性网络4.Early Stopping4.Early Stopping1.Ridge Regression (岭回归,又名 Tikhonov regularization)线性回归+L2正则具体的损失函数目标函数 = 损失函数...

2020-02-26 14:38:52 1394

原创 你知道机器学习中的维灾难吗?——一个有趣的猫狗分类案例帮你理解

维灾难1.什么是维灾难特征数量比较少的时候,越多特征,分类器性能越好到达某点之后,分类器性能逐渐下降随着维度的增加,分类器性能逐步上升,到达某点之后,其性能便逐渐下降有一系列的图片,每张图片的内容可能是猫也可能是狗;我们需要构造一个分类器能够对猫、狗自动的分类。首先,要寻找到一些能够描述猫和狗的特征,这样我们的分类算法就可以利用这些特征去识别物体。猫和狗的皮毛颜色可能是一个很好的特征,...

2020-02-26 11:38:12 914

原创 机器学习时不知道建立多复杂的模型怎么办?——正则化

文章目录正则化1.什么是正则化2.正则化类别**具体如何正则化线性模型?请看接下来的“正则化系列”的博客。**正则化1.什么是正则化不知道建立模型的时候建立到多复杂才合适怎么办?那么我们先做到模型足够复杂!足够的复杂之后,会有一个冗余的复杂度,容易过拟合。因此,我们可以通过正则化的方法,将冗余的复杂度降低。思路:剔除高次项的,将高次项的系数变成0或者趋近于0。在解决回归过拟合中,我们...

2020-02-26 11:27:19 395

原创 机器学习时模型不够复杂——欠拟合,模型过于复杂——过拟合

文章目录欠拟合与过拟合1.定义2.原因以及解决办法(1)欠拟合1.欠拟合原因2.欠拟合解决办法(2)过拟合1.过拟合原因2.过拟合解决办法欠拟合与过拟合1.定义过拟合:训练集的误差小,但测试集的误差大一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)欠拟合:模型很简单的时候,两个误差都比较...

2020-02-26 10:32:53 4150

原创 机器学习——线性回归的API速查手册(详细版)

线性回归api再介绍sklearn.linear_model.LinearRegression(fit_intercept=True)通过正规方程优化fit_intercept:是否计算偏置LinearRegression.coef_:回归系数LinearRegression.intercept_:偏置sklearn.linear_model.SGDRegressor(loss...

2020-02-25 23:35:17 490

原创 梯度下降法算法总结

文章目录梯度下降(Gradient Descent)什么是梯度下降梯度的概念梯度下降举例梯度下降**(**Gradient Descent)公式**优化动态图演示**梯度下降法介绍1 全梯度下降算法(FG)2 随机梯度下降算法(SG)3 小批量梯度下降算法(mini-bantch)4 随机平均梯度下降算法(SAG)5 算法比较6 梯度下降优化算法(拓展)梯度下降(Gradient Descent...

2020-02-25 23:33:55 8536 3

原创 机器学习线性回归(六):线性回归从入门到精通——正规方程优化和梯度下降法优化

文章目录线性回归简介线性回归应用场景什么是线性回归定义与公式线性回归的特征与目标的关系分析线性回归api初步使用线性回归API举例步骤分析代码过程数学:求导常见函数的导数导数的四则运算练习3.1 y = x^3-2x^2+sinx,求f`(x)3.2 y=ln(sinx), 求dy/dx矩阵(向量)求导 [了解]线性回归的损失和优化损失函数优化算法正规方程什么是正规方程正规方程求解举例正规方程的推...

2020-02-25 23:29:02 795

原创 机器学习案例(二):波士顿房价预测——基于正规方程优化及梯度下降优化(附源码)

波士顿房价预测——基于正规方程优化及梯度下降优化数据代码下载地址项目链接+源代码:https://github.com/w1449550206/Boston-house-price-forecast.git文章目录波士顿房价预测——基于正规方程优化及梯度下降优化数据代码下载地址数据介绍1 分析2 回归性能评估详细步骤【正规方程优化的线性回归】1.获取数据 load_boston2.数据基本处...

2020-02-25 23:17:54 3566 1

原创 LeetCode力扣刷题数据库(184):部门工资最高的员工

题目Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。Department 表包含公司所有部门的信息。编写一个 SQL 查询,找出每个部门工资最高的员工。例如,根据上述给定的表格,Max 在 IT 部门有最高工资,Henry 在 Sales 部门有最高工资。分析-- 查看员工表SELECT * FROM empl...

2020-02-25 11:38:44 2838

原创 线性回归的常用求解方法之梯度下降法(二):Python封装梯度下降线性回归

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import SGDRegressoriris = loa...

2020-02-24 23:20:41 651

原创 线性回归的常用求解方法之梯度下降法(一):梯度下降法求最小值,看不懂你打我

文章目录梯度下降什么是梯度下降案例梯度下降什么是梯度下降梯度其实就是斜度,就是一个曲面沿着指定方向的倾斜程度。梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(i.e. 找到山的最低点,也就是山谷)。那么如何快速的下山?寻找这个位置最陡峭的地方,然后朝着山的高度下降的地方走,对于计算机来说就是没走一段重新寻找坡度最陡峭的地方。梯度下降的...

2020-02-24 23:19:00 3211

原创 线性回归的常用求解方法之最小二乘法(三):最小二乘法回归带来的问题

文章目录损失的部分可以叫做残差,考虑大部分人生成了系数,所以有残差也很正常最大的问题是:每添加一条数据,残差都不一样。评估方法:最常用的评估项R^2的取值越接近1我们认为模型拟合的越好...

2020-02-24 22:56:16 901

原创 线性回归的常用求解方法之最小二乘法(二):最小二乘回归的数据计算意义

文章目录基础知识高斯分布误差是服从高斯分布的代码3个样本5个样本基础知识误差ε^(i)是独立并且具有相同的分布,并且服从均值为0方差为θ2的高斯分布独立:张三和李四一起来贷款,他俩没关系同分布:他俩都来得是我们假定的这家银行高斯分布:银行可能会多给,也可能会少给,但是绝大多数情况下这个浮动不会太大,极小情况下浮动会比较大,符合正常情况高斯分布蓝点是薪资用线连起...

2020-02-24 22:48:05 2201

原创 线性回归的常用求解方法之最小二乘法(一):最小二乘回顾意义通俗理解+工资和年龄对贷款金额的影响案例案例

文章目录平方误差对w求导一个线性回归的例子平方误差平方误差可以写作对w求导对w求导,当导数为0的时候,平方误差最小,此时w等于解释:我们的目的是求y=wx+b+e中的w和b,先使平方误差最小,也就是导数为0,此时w就求出来了,然后b就也求出来了了。一个线性回归的例子数据:工资和年龄(2个特征)目标:预测银行汇贷款给我多少钱(标签)考虑:工资和年龄都会影响最终银行贷款的结果那么...

2020-02-24 22:10:46 883

Power BI自定义图表.rar

附件中是Power BI如何导入自定义视觉图像(附上百种自定义视觉图像),可以直接导入使用~~~解压缩之后,打开Power BI软件,选择最右边的导入自定义视图即可

2020-03-08

线性回归公式求解.ipynb

对应博客:https://blog.csdn.net/qq_35456045/category_9697906.html

2020-02-24

seaborn-data.rar

这个是啊seaborn的数据集,它里面包括鸢尾花的数据,小费的数据集,因为很多人在官网上下不下来,然后用iris = sns.load_dataset('iris')的方法下载起来也会jupyter notebook卡顿,所以我将seaborn的所有数据集传上来,仅供有需要的同学下载。

2020-02-18

hr必问100问.txt

hr面试题库,包括很多常见问题以及一些想不到的问题!!!重要的是里面都有详解和答题思路和逻辑,是程序员面试必备的资料哦

2020-02-14

numpy数据分析源代码+大数据的读取_.ipynb

blog链接:https://blog.csdn.net/qq_35456045/article/details/104319408 详细的,有解释的源代码哦 pandas数据处理 1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True df.duplicated() 返回bool型的值,如果不重复返回false ,有重复值返回Ture 2. 映射 使用replace()函数,对values进行替换操作 1)replace还经常用来替换NaN元素 2) rename()函数:替换索引 3) map()函数:新建一列 transform()和map()类似 apply() agg() 3. 异常值检测 4. 排序 sort_values() sort_index() 5. 数据聚合【重点】 add_prefix()添加前缀 可以使用transform和apply实现相同功能 离散化和分箱 奥巴马VS罗姆尼 时间序列 重采样 大数据读取

2020-02-14

pandas中绘图函数.ipynb

pandas中绘图函数,Series和DataFrame都有一个都有一个生成各类图标的plot方法,默认情况下锁生成的都是线形图,包括线形图、柱状图、直方图、散点图、随机百分比密度图、散布图等,有一些汽车和鸢尾花的案例。代码详细有说明。python实现的。对应的blog专栏: https://blog.csdn.net/qq_35456045/category_9709051.html

2020-02-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除