python
文章平均质量分 86
Blanche117
只有站在高处,低头才有意义.
展开
-
决策树入门以及树模型的参数选择
决策树及树模型的参数选择决策树的基本概念在数据结构中树是一个重要的数据结构,这里树被我们根据分支起到一个决策的作用。什么是决策?通俗的说就是判断或者决定,我们引用周志华的西瓜书中的例子:这是一个好瓜吗?当我们对这个问题进行决策的时候通常会进行一系列的子决策或者判断,比如,我们先看“它是什么颜色的?”,如果是“青绿色”我们再看“它的根蒂是什么形态的?”,如果是“蜷缩”,我们再判断“它敲起来的声音是什么样的?”,最终我们判断它是一个好瓜。这样的一个判断的过程就是决策,是基于下面的树的结构完成的。决策树有原创 2021-02-02 21:19:23 · 6119 阅读 · 0 评论 -
Logistic Regression实例企业还款能力评估
企业还款能力评估步骤:读入数据划分训练集和测试集训练模型测试效果并绘制混淆矩阵import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinedata_1 = pd.read_csv("企业贷款能力评估.csv")print("行数:",data_1.shape[0],"列数:",data_1.shape[1])data_1.原创 2021-01-31 16:05:34 · 806 阅读 · 2 评论 -
逻辑回归模型:信用卡欺诈分析
逻辑回归案例分析——信用卡欺诈本次案例为信用卡欺诈数据,一共包含31个自变量,其中因变量Class表示用户在交易中是否发生欺诈行为(1表示欺诈交易,0表示正常交易)。由于数据涉及敏感信息,其中V1~V28自变量做了标准化处理。本次案例涉及到分类问题中类别比例严重失调的情况下应该如何应对,当然主要任务是对0-1样本即正常与异常样本的区分。类别比例失调如何处理正负样本的划分首先是库的导入操作:import numpy as npimport matplotlib.pyplot as pltim原创 2021-01-30 23:28:14 · 2186 阅读 · 0 评论 -
机器学习——逻辑回归算法
机器学习——回归算法一、线性回归算法概述1.背景引入银行贷款,如下图,共有5组数据,每组数据具有两个特征:工资-年龄。通过这两个属性:工资-年龄,预测得到的贷款额。特征工资年龄有监督的机器学习算法可以分作两个类别:回归和分类通俗的解释如果背景转换,来到银行是为了得知自己能不能得到一笔贷款,那么这个问题就是属于分类问题了。即最后得到的是一个类别。我们做下面的规定:x1,x2x_1,x_2x1,x2是我们的两个特征(年龄,工资),yyy是银行最终会贷款给我们多少。我们要做原创 2021-01-27 00:35:22 · 457 阅读 · 0 评论 -
数据分析matplottlib库图像绘制
matplotlib-图的绘制折线图的绘制日期的标准化:to_datetime()对于“unrate.csv”文件记录的是时间与美国的失业率的数据。其中时间的格式为%d/%m/%y所以为了绘制出两个变量的关系的折线图,我们首先要将日期标准化:1/17/07 has the format “%m/%d/%y”17-1-2007 has the format “%d-%m-%Y”将第一种格式转化为第二种格式(或者年份在前)import pandas as pdunrate = pd.rea原创 2021-01-26 10:46:53 · 342 阅读 · 0 评论 -
Pandas库Series基本操作
Series的概念之前讲述的一直是DataFrame结构,也是Pandas中最核心的结构我们把dataFrame进行分解,其中的一行,或者一列,就是一个Series结构。Series:collection of valuesDataFrame: collection of Series objectsimport pandas as pdfandango=pd.read_csv("fandango_score_comparison.csv")#提取一个列,一个列就是一个seriesse原创 2021-01-25 19:41:22 · 2811 阅读 · 1 评论 -
Pandas库数据基本处理
Pandas常用预处理办法使用关于泰坦尼克号的获救人信息csv表格进行常见的数据预处理缺失值的剔除pivot_table()函数对数据进行透视处理dropna()方法对缺失值进行丢弃.loc()函数对变量进行定位import pandas as pdimport numpy as nptitanic_survival=pd.read_csv("titanic_train.csv")titanic_survival.head() Pass原创 2021-01-25 00:12:15 · 331 阅读 · 3 评论 -
NumPy库学习:数据分析Chapter1
数据分析学习笔记1.基础概念和环境1.1课程概要概要{基础概念和环境matplotlib画图numpy处理数值型数组pandas处理字符串,列表,字典等其他的数据类型概要\begin{cases}基础概念和环境\\matplotlib \quad\text{画图}\\numpy \qquad\text{处理数值型数组}\\pandas \qquad\text{处理字符串,列表,字典等其他的数据类型}\\\end{cases}概要⎩⎪⎪⎪⎨⎪⎪⎪⎧基础概念和环境matplotlib画图n原创 2021-01-23 22:06:17 · 219 阅读 · 0 评论 -
Python学习笔记:Chaper3高级特性
Python学习笔记第三弹一级目录二级目录三级目录3.1高级特性3.1.1切片3.1.2迭代3.1.3列表生成器3.1.4生成器3.1.5迭代器3.2函数式编程3.2.1高阶函数3.2.1.1map和reduce1.map2.reduce3.2.1.2 filter3.2.1.3 `sorted`函数3.3模块作用域一级目录二级目录三级目录3.1高级特性3.1.1切片List在python语言中很常用,取出list中的元素也是频繁的操作。如何取出list中元素,学习过循环后,自然地想到了使用循环原创 2021-01-22 19:42:57 · 326 阅读 · 0 评论 -
Python学习笔记Chaper2
Python学习笔记Chaper2Python学习之函数Python学习笔记Chaper2一级目录二级目录三级目录2.1函数2.1.1调用函数2.1.2定义函数2.1.2.1函数的定义方法2.1.2.2空函数的使用2.1.2.3参数类型的检查2.1.2.4python和其他语言的函数定义对比2.1.3函数的参数2.1.3.1默认参数2.1.3.2可变参数2.1.3.3关键字参数2.1.3.4命名关键字参数2.1.3.5参数组合2.1.3递归函数2.1.3递归函数一级目录二级目录三级目录2.1函数原创 2021-01-21 18:13:24 · 105 阅读 · 0 评论 -
Python学习笔记Chaper1
Python学习笔记Python的环境配置不再多说,成功配置完系统后,就可以在终端会话中运行python了。一、运行python1.进入python交互式环境在“开始”菜单栏输入command,按回车,即可打开一个命令窗口在终端窗口中输入python,若是安装成功,会出现符号:>>>这样我们就进入了python的交互式环境,可以在这个窗口中运行python了,比如执行经典的输出"Hello Word"语句,或者是进行简单的运算:2.退出交互式环境每当要原创 2021-01-20 23:53:22 · 337 阅读 · 0 评论