自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 天池幸福感挖掘分析与预测

数据链接我们先导入数据以及一些会用到的包#导入数据包import pandas as pdimport numpy as np#调整显示范围,显示更多的列pd.options.display.max_rows = 10pd.options.display.max_columns = 45#导入训练数据集train = pd.read_csv('./happiness_train_abbr.csv')#导入测试数据集test = pd.read_csv('./happiness_te

2020-12-26 14:55:28 1057

原创 KNN回归,缺失值处理以及pipeline

上一节我们用knn在鸢尾花数据集上做了分类,现在我们就来用knn做回归预测。1.1 模拟数据集——knn回归首先导入需要用到的包#Demo来自sklearn官网import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsRegressor创建训练样本,标签与测试集np.random.seed(0)# 随机生成40个(0, 1)之前的数,乘以5,再进行升序(训练样本

2020-12-23 22:32:42 1851 2

原创 用knn做分类

前面讲knn理论的时候,就说到了knn既能做分类也能做回归。下面我们就先来学习一下用knn在鸢尾花数据集上做分类。1. knn分类——二维数据集先导入我们需要用的包import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn import d

2020-12-22 22:40:45 697

原创 K近邻(KNN)算法理论

1 KNN的介绍和应用1.1 KNN的介绍kNN(k-nearest neighbors),中文翻译K近邻。我们常常听到一个故事:如果要了解一个人的经济水平,只需要知道他最好的5个朋友的经济能力,对他的这五个人的经济水平求平均就是这个人的经济水平。这句话里面就包含着kNN的算法思想。示例 :如上图,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。

2020-12-21 21:50:27 592

原创 利用模拟的离散数据集进行贝叶斯分类

前面我们用鸢尾花数据集做了贝叶斯分类,现在我们就自己模拟离散数据集来做贝叶斯分类。1. 在模拟的离散数据上使用贝叶斯分类首先同样的先导入我们需要用到的包import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection import train_test_split生成样本数据和标签,并将数据划分为训练集和测试集

2020-12-20 22:05:39 542

原创 利用鸢尾花数据集实践贝叶斯分类

前面我们已经详细介绍过鸢尾花数据集以及sklearn的使用,下面我们就来调用sklearn中的贝叶斯分类器来实现鸢尾花数据集的分类。首先,我们需要导入需要用到的包,模型以及数据集import numpy as np# 导入sklearn中有关于数据集的包from sklearn import datasets# 导入高斯朴素贝叶斯分类器from sklearn.naive_bayes import GaussianNBfrom sklearn.model_selection import

2020-12-19 19:36:52 3625 2

原创 朴素贝叶斯算法理论

首先不得不说贝叶斯公式真的是一个很有用的公式,它出现在我们生活中的各个地方,只是我们没有察觉到而已。生活中,我们可以通过贝叶斯来预估第二天的天气,判断半夜跟你聊天的女孩是否也喜欢你,发烧被确诊是新冠的概率等等。例子一假如头一天晚上,你和你的小伙伴兴起,准备明天外出郊游,但天气预报已经过了,不知道明天是否会下雨,该怎么办呢?这个时候,你的小伙伴小黄就站出来了,说到:“吾夜观天象,明天应该会下雨”,你问到为啥呀,小黄答道:“因为今夜乌云密布,一般这样的天气,第二天就会降雨。”大家都默默的点头道,好像是这

2020-12-18 22:31:07 251 2

原创 基于鸢尾花数据集的逻辑回归分类实践

前面我们用sklearn简单的实现了逻辑回归,数据集是我们自己所创造的,并不能很好的代表我们用逻辑回归对真实数据进行分类的效果。所以下面我们就基于一份真实的数据来进行逻辑回归吧。先来介绍一下本节需要用到的数据集。1. 鸢(yuan)尾花数据集1.1 数据集介绍鸢尾花数据集也叫iris数据集,是一个学习机器学习用于分类的常用的入门级的数据集。该数据集总共有150条数据,分为3类(Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢

2020-12-17 17:30:37 5209

原创 利用sklearn实现逻辑回归

1. sklearn介绍在利用sklearn实现逻辑回归前,可能会有人疑惑sklearn究竟是什么,那在这之前,我们先来看一下sklearn是一个什么东西吧。先字面解释一下:Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 的设计非常好,所有对象的接口简单,很适合新手上路。(简单粗暴地说就是:sklearn里面已经集成好了很多机器学习算法,并且需要的相关依赖也解

2020-12-16 22:21:15 8780

原创 逻辑回归算法理论

逻辑回归理论机器学习最常用的两种场景无非是分类、回归,其中:分类:预测连续的、具体的数值。比如:支付宝里的芝麻信用分数评估,房价预测等。回归:对各种事物分门别类,用于离散型预测。比如:图片分类,癌症类型诊断等。当然机器学习除了分类、回归以外,还可用于聚类、降维等。首先要明白的是逻辑回归是一个分类算法,不要被名字迷惑了,可用于二分类,多分类等。下面来讲讲逻辑回归的理论知识:对于分类问题,简单来讲,就是预测概率,对于二分类问题,我们通常用y=0或者y=1来表示样本标签,我们预测该样本标签y=0y=

2020-12-15 21:03:49 169

原创 2020-12-02

深度学习优化器之梯度下降最近在学习lstm网络的调参等问题,想整理一下优化器,学习率,batch_size,以及timestep等参数,因为学习率一般也是和优化器捆绑的,所以就先来记录一下自己学习的优化器的相关知识吧。最开始学深度学习的时候,是跟的吴恩达老师的视频,当时对概念啥的以及大概的实现方式有了了解,但一直没有动手去实现,所以感受不是很深。因为最近又需要用到相关知识,所以又找资料准备从新学一下。梯度下降和随机梯度下降在本节中,我们将介绍梯度下降(gradient descent)的工作原理。虽

2020-12-02 10:00:07 276

原创 graphviz下载及安装及遇到的问题

首先说明我的电脑是64位, windows系统在学习模型可视化的时候,遇到了下面的问题:Failed to import pydot. You must install pydot and graphviz forpydotprintto work.于是用conda install pydot 以及 conda install graphviz,重启kernal运行,仍然报错:InvocationException: GraphViz's executables not found下面是通过查阅

2020-11-22 22:34:18 4586

原创 如何在jupyter notebook中添加已存在的虚拟环境

首先win+r进入终端,然后通过conda activate 环境名进入到你想要添加到jupyter中的环境此处我的环境名为GA-LSTM,可以看到我已经进入到相应的环境中了。然后conda install nb_conda,完成之后,在输入命令jupyter notebook,回车,大功告成。检查方法一:启动jupyter notebook后,点击右上角的下拉菜单New,可以看见notebook的选项增加了,我们就可以选择在相应的环境下创建notebook了;方法二:电..

2020-11-01 22:08:53 2601

原创 Loaded runtime CuDNN library: 7.4.1 but source was compiled with: 7.6.0.

win10 CUDA 10.0 cudnn 7.4.1E tensorflow/stream_executor/cuda/cuda_dnn.cc:319] Loaded runtime CuDNN library: 7.4.1 but source was compiled with: 7.6.0. CuDNN library major and minor version needs to match or have higher minor version in case of CuDNN

2020-10-30 19:15:17 3070 4

原创 ModuleNotFoundError: No module named ‘pyparsing‘, ImportError: cannot import name ‘animation‘

导入matplotlib时,出现 ModuleNotFoundError: No module named ‘pyparsing’, ImportError: cannot import name ‘animation’ from ‘matplotlib’ (C:\Users\WBY\AppData\Roaming\Python\Python37\site-packages\matplotlib_init_.py)import matplotlib as plt出现如下报错:于是:pip uni

2020-10-29 22:25:24 8589 3

原创 windows下如何实时更新gpu利用率等信息

windows下如何实时更新gpu利用率等信息windows当我们在用gpu训练模型的时候,我们想知道gpu的相关信息,可以使用以下方法:在命令窗口输入:nvidia-smi.exe -l 5(每5秒更新一次gpu的信息,更新频率最高可设置为1s/次,ctrl+c停止更新)ubutnu在终端输入:watch -n 5 nvidia-smi(5s更新一次)或者nvidia-smi -l 5(5s更新一次)...

2020-10-24 20:57:39 2407 1

原创 宝可梦数据分析

python入门——天池task4——宝可梦数据分析数据集下载# 数据集下载,也可以通过网页链接下载!wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon.csv然后导入我们需要用到的相关包,此处为Pandas, Seaborn, Matplotlib, 并且读取数据import pandas as pdimport seaborn as snsimpo

2020-09-15 23:56:36 966 1

原创 python入门学习笔记——天池task3(day3)——魔法方法

python入门学习笔记——天池task3(day3)——魔法方法魔法方法在python中,有一些内置好的特定的方法,这些方法在进行特定的操作时会自动被调用,称之为魔法方法,魔法方法总是被双下划线包围,例如__init__。魔法方法的“魔力”体现在它们总能够在适当的时候被自动调用。魔法方法的第一个参数应为cls(类方法) 或者self(实例方法)。cls:代表一个类的名称self:代表一个实例对象的名称基本的魔法方法__ init __:__init__(self[, ...])构造器

2020-09-14 22:32:29 115

原创 python入门——天池task3(day2)——类与对象

python入门——天池task3(day2)——类与对象类定义使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。格式如下:class ClassName(): #类的命名一般首字母大写,括号中参数可带可不带,带只能带继承的基类名称 '这里可写类的说明文档' <statement-1> . . . <statement-N>类对象类对象支持两种操作:属性引用和实例化。属性引用:使用和python中所有

2020-09-13 22:44:05 85

原创 python入门——天池task3(day1)

函数参数Python 的函数具有非常灵活多样的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。从简到繁的参数形态如下:位置参数 (positional argument)默认参数 (default argument)可变参数 (variable argument)关键字参数 (keyword argument)命名关键字参数 (name keyword argument)参数组合Lambda 表达式...

2020-09-12 22:38:09 116

原创 python入门——天池task2(day3)

集合的交,并,差,异或,以及zip(),zip(*)1.集合的交,并,差,异或由于 set 是无序和无重复元素的集合,所以两个或set 可以做数学意义上的集合操作。set.intersection(set1, set2) 或者 set1.intersection(set2, set3...)返回两个集合的交集。set1 & set2 返回两个集合的交集。set1.intersection_update(set2, set3...) 或者set.intersection_update(s

2020-09-11 22:39:15 140 1

原创 python入门——天池task2(day2)——字符串list,字典dictionary

find(), rfind(),maketrans(), ‘\r’, ‘\n’, ‘\r\n’1. find(), rfind()find(str, beg=0, end=len(string)) 检测 str 是否包含在字符串中,如果指定范围 beg 和 end,则检查是否包含在指定范围内,如果包含,返回开始的索引值,否则返回 -1。rfind(str, beg=0,end=len(string)) 类似于 find() 函数,不过是从右边开始查找。【例子1】str1 = '01234567

2020-09-10 22:07:07 113

原创 python入门——天池task2(day1)深拷贝,浅拷贝

python入门——天池task2(day1)深拷贝,浅拷贝首先先了解一下python6个标准的数据类型分别是number,string,tuple,list,dictionary,set。本文我们将用copy()和deepcopy()两个函数来实现浅拷贝和深拷贝。浅拷贝:copy()对于不可变类型number,string,tuple,浅拷贝只复制地址的指向,而不会开辟新的空间;【例子1】num1 = 1num2 = copy(num1) #浅拷贝,地址不变num3 = copy(nu

2020-09-09 22:34:19 128

原创 python入门——天池Task1(day3——异常处理)

python入门——天池Task1(day3——异常处理)5 异常处理5.1 try - except 语句5.2 try - except - else 语句5.3 try - except - finally 语句6. raise 语句5 异常处理5.1 try - except 语句表达式:try: 检测范围except Exception[as reason]: 出现异常后的处理代码try 语句按照如下方式工作:1.首先,执行try子句(在关键字try和关键字exc

2020-09-08 19:07:50 243 2

原创 python入门——天池Task1

python入门——天池Task13.条件语句3.1 if语句3.2 if - else 语句3.3 if - elif - else 语句3.4 assert 关键词4.循环语句4.1 while 循环4.2 while - else 循环4.3 for 循环4.4 for - else 循环4.5 range()函数4.6 enumerate()函数4.7 break语句4.8 continue语句4.9 pass 语句4.10 推导式(补充)4.10.1 LIst 列表4.10.2 Tuple

2020-09-07 20:07:38 310

原创 python入门——天池Task1

python入门——天池Task11.变量、运算符与数据类型1.1 运算符——位运算符(补充)1.1.1 2进制,8进制,10进制,16进制在python中的表示方法和互相转换函数1.1.2 位运算符1.1.3 其他运算符1.2 数据类型转换(补充)1.2.1 decimal常用方法1.2.2 isinstance()函数1.3 print()函数2.位运算2.1 源码,反码和补码(补充)条件语句1.if语句2.if-else语句3.if-elif-else语句4.assert关键词循环语句1.while循

2020-09-06 18:50:54 171

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除