自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wyh_wen

乐于分享学习,共同进步!

  • 博客(31)
  • 资源 (9)
  • 收藏
  • 关注

原创 笔试必备:48道SQL练习题(Oracle为主)

练习主要涉及四张表,分别如下:student(sid,sname,sage,ssex) 学生表course(cid,cname,tid) 课程表score(sid,cid,score) 成绩表teacher(tid,tname) 教师表首先建立表结构CREATE TABLE student ( sid INT, sname varcha...

2019-07-10 17:54:53 2977 2

原创 【Leetcode】——python实现

1.两数之和给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]answe...

2019-04-01 16:08:58 147

原创 经典算法(四):KNN

一、算法概述 KNN也称为K近邻或最近邻(nearest neighbor),从字面来理解就是根据测试样本相对最近(属性相对最近)的K个训练样本的类别来决定该测试样本的类别(少数服从多数)。KNN是一种惰性学习方法(不需要训练模型),主要处理分类问题。有惰性学习方法,那么也有积极学习方法,前面讲到的决策树是积极学习方法。那怎么判断属性相对最近呢?其实KNN算法在寻找相对最近样本时...

2019-03-30 16:46:12 766

原创 经典算法(三):决策树

一、决策树概念 在经典算法中,决策树是常用的算法之一。前面提到的线性回归可以解决回归问题,逻辑回归可以解决分类问题,而今天要学习的决策树不但可以回归问题,还可以解决分类问题。顾名思义,决策树分为两种树,回归树和分类树。在分类算法中,决策树是根基。现在常用的随机森林也是基于多个决策树集成的算法。从名称可以看出,决策树是含有分叉的树状算法。决策树思想是寻找最纯净的划分方法,...

2019-03-19 16:58:51 746

原创 经典算法(二):逻辑回归

  目录     一、逻辑回归数学来源    二、极大似然法    三、逻辑回归算法过程    四、逻辑回归算法Python实战  一、逻辑回归数学来源              说到算法,我们首先想到的是线性回归和逻辑回归这两种基础算法,上一篇博文详细学习线性回归,我们都知道线性回归是回归算法,可以得到实值。而在名称上类似的逻辑回归虽然也有“回归”两个字,但是逻辑回归...

2018-11-19 16:46:52 357

原创 经典算法(一):线性回归

前言1. 基本形式2. 损失函数 2.1 损失函数 2.1.1 最小二乘法 2.1.2 极大似然估计 2.2正规方程法 2.2.1 一般形式 2.2.2 矩阵形式 2.3梯度下降法 2.3.1梯度下降法的代数方式描述 ...

2018-11-06 23:07:27 3394

原创 48道SQL练习题(Oracle+MySQL)

SQL面试经典题目详细参考48道SQL练习题(Oracle+MySQL)

2020-03-18 17:46:17 442

原创 Python连接Oracle

Python连接Oracle数据库,由于python没有自带的模块可以解决该问题,需要借助其他模块,经常会出现问题,所以记载一下自己连接的过程,方便自己回看,也希望可以帮助到需要的人。一、下载安装cx_Oracle模块:1、直接下载:https://pypi.python.org/pypi/cx_Oracle2、通过命令行下载安装(推荐):二、Oracle instant cl...

2020-01-13 17:04:54 1356 3

原创 Python.matplotlib可视化

matplotlib是Python中可视化的模块,接下来将一点点学习可视化。持续更新。。。#导入模块import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline #Jupyter Notebook在线绘图语句,如果不添加该语句,图片无法显示#防止中文乱码plt.rc...

2019-09-18 14:46:17 188

原创 牛客网SQL练习

为了提升自己的SQL能力,决定认真刷题,先从牛客网开始。于是做一下刷题记录。1.查找最晚入职员工的所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NO...

2019-08-28 17:24:06 339

原创 python基础任务六(turtle画佩奇)

下面是用turtle画出小猪佩奇,使用turtle画图很有意思,有空再尝试其他图形。from turtle import*def nose(x,y):#鼻子 (公众号:数据分析联盟) penup()#提起笔 goto(x,y)#定位 pendown()#落笔,开始画 setheading(-30)#将乌龟的方向设置为to_angle/为数字(0-东、90-...

2019-04-10 20:44:45 304

原创 python基础任务五(文件、模块和正则表达式)

1.filea.打开文件方式(读写两种方式)open( )用于打开文件,可以设置打开文件的格式。#常用的参数有两个open(file,mode='r')#完整的语法open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)fi...

2019-04-09 20:42:00 214

原创 python基础任务四(函数)

1. 内置函数2. 函数的定义函数可以用于调用,方便,可以自定义。自定义函数的简单规则:函数代码块以def关键词开头,后接函数标识符名称和圆括号()。 任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。 函数内容以冒号起始,并且缩进。 return [表达式]结束函数,选择性地返回...

2019-04-06 15:31:59 230

原创 python基础任务三(字典、集合和条件结构)

一、字典1.创建字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 。dict1={key1:value1,key2:value2}键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。dict1={'me':23...

2019-04-04 17:43:32 260

原创 python基础任务二(字符串、列表和元组)

一、字符串1.创建字符串字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。创建字符串很简单,只要为变量分配一个值即可。var1='apple'var2='Hello World!'2.访问字符串中的值Python不支持单字符类型,单字符在 Python 中也是作为一个字符串使用。Python访问子字符串,可以使用方括号来截取字符串。...

2019-04-02 15:06:49 698

原创 python enumerate( )函数用法

一、enumerate( )函数说明1.enumerate()是python的内置函数2.enumerate在字典上是枚举、列举的意思3.对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值。(即可以将一个可遍历的数据对象组合为一个索引序列,同时列出数据和数据下标。)4.enumerate多用于在f...

2019-04-01 17:29:42 169

原创 python基础任务一(环境搭建和简单运算)

1. 环境搭建 a) anaconda环境配置anaconda可以在官网下载并安装,安装步骤较容易。安装完毕后需要配置环境变量,步骤如下:(1)首先找到anaconda的路径,并找到Scripts文件,双击进入(2)复制该文件的路径(3)右键单击“我的电脑”,选择“属性”,进入下图页面点击“高级系统设置”(4)点击“环境变量”(5)系统变量中找到“...

2019-03-31 11:39:12 271

原创 预测贷款用户是否逾期:数据清洗与预处理

任务一做一个项目的第一步是数据清洗与预处理,也是对数据进行探索和分析。这份数据集是金融数据,我们的目标是要预测贷款用户是否会逾期,其中status表示标签,1表示逾期,0表示未逾期。1.查看数据可以使用excel或者SPSS等分析软件打开文件进行查看,当然是数据量允许的情况下才能用excel打开,否则你的电脑会一直转圈圈。还有就是可以导入python查看,一般python导入数据使用的...

2019-03-04 09:07:39 982

转载 特征选择

特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。1 特征重要性​度量计算某个特征X的重要性时,具体步骤如下:1)对每一颗决策树,选择相应的袋外数据(out of bag,OOB)​计算袋外数据误差,记为errOOB1.所谓袋外数据是指,每次建立决策树时,通过重复抽样得到一个数据用于训练​决策树,这时还有大约1/3的...

2019-02-19 16:27:42 173

原创 模型评估指标(分类模型、回归模型)

一、分类指标1.精确率(precision): (预测为正的里面预测对的概率)2.召回率(recall):(真实为正的里面预测对的概率)3.F1值: (对精确率和召回率赋不同权重进行加权调和)4.准确率(accuracy):5.错误率(error rate):6.ROC:绘制ROC曲线,首先对所有样本按预测概率排序,以每条样本的预测概率为阈值...

2019-01-26 14:48:52 1674

原创 python常用函数总结(一)

一、输入输出函数1、print()函数#输出指定的内容print('hello world')#可以同时输出多个字符串,用逗号‘,’隔开print('hello','how','are')#可以进行计算并输出结果;若对输出结果加上引号'',则不能进行计算,直接输出print(200+300)print('200+300')#使用‘+’将字符串连接,且不产生空格pri...

2019-01-16 16:41:23 424

原创 入门python代码系列:简单线性回归(二)

1.数据预处理数据预处理的详细请参考前一篇博文(数据清洗与预处理),这里简单带过。import numpy as npimport pandas as pdimport matplotlib.pyplot as plt #导入可视化模块data=pd.read_csv('E:/data/studentscores.csv')X=data.iloc[:,:1].valuesy...

2018-12-12 15:22:54 474

原创 入门python代码系列:数据清洗与预处理(一)

       对于刚接触机器学习或者数据分析的同学来说,看大佬们比赛的代码是很难的,一头雾水,都是看不懂的,心里很慌。所以对于初学者来说,还是需要回归简单,只有掌握基础,才能不断深入,我是深有体会的,不知道你感觉如何?接下来我将梳理一套针对初学者的代码系列,希望可以帮助大家也受益自己。1.导入需要的库import numpy as npimport pandas as pd2.导入...

2018-12-07 17:54:32 1682

原创 LogisticRegression在sklearn中的参数详解

LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', ver...

2018-12-06 16:07:44 4639

原创 一元线性回归VS多元线性回归

      一元线性回归和多元线性回归表面意思容易理解,但是结合实际的数据集,会混乱。这也是在编写线性回归博文的时候梳理知识点发现自己的不足,同时记录下来,让有疑问的同学也可以得到答案,拨开乌云。1.在数据集上的异同一元线性回归:给定数据集,其中,样本有1个属性描述。VS多元线性回归:给定数据集,其中 ,,样本有d个属性描述。 2.向量表达式一元线性回归: ...

2018-11-10 21:25:40 3798

原创 线性回归的数学推导

线性回归是最基础的算法,同时也是其他高级算法的根基,下面就和大家一起进攻基础算法之线性回归。线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型,那模型的好坏关键在于真实值与预测值之间的差异 。一般表达式                                             向量表达式                        ...

2018-10-26 10:00:04 434

原创 多元线性回归矩阵求导

2018-10-13 15:00:34 2451 4

原创 一元线性回归最小二乘法

      这个推导过程虽然简单,但是偶尔会犯错,一点的失误会造成耗费大量时间。其实,这过程是根据损失函数,对w和b进行求导,解方程组,则可以得到w和b。下面详细讲解该过程。     损失函数                                                               求该式子的最小值,需要对它进行求导                ...

2018-10-13 14:17:18 2818

原创 将Excel、TXT文件通过MySQL workbench导入到数据库

导入Excel文件的步骤:1.先将Excel文件另存为以逗号分隔的csv格式,可用记事本打开确认是否是以逗号为分隔符;2.打开workbench,右键要插入的数据库,选择Table Data Import Wizard3.导入文件,next4.如果数据库中存在该表,则勾选图中红色数字1的圆圈;如果想重新创建表,则勾选图中红色数字2的圆圈,为了防止存在该表出现错误,建议勾...

2018-09-21 15:17:36 9172 2

原创 Oracle SQL developer 几点常见的错误

1. Oracle查询时出现‘ORA-00911:无效字符’。该错误说明查询语句中存在中文字符,只需要改正即可。2. Oracle中的分组函数 group by 使用与MySQL有所不同在Oracle中Group by 分组时select后面提取的字段要有队分组列进行聚合的函数(count()、sum()等),否则会出错。   例如:select * from student gr...

2018-09-20 15:50:53 572

原创 Logistic回归的一般步骤

(1)收集数据:采用各种方法收集数据,比如爬虫等;(2)准备数据:因为需要计算距离,所以数据类型应该是数值型,最好是结构化数据格式;(3)分析数据:通过业务的角度或者其他的方法分析数据;(4)训练算法:这是关键的一步,训练的目的是找到最佳的分类回归系数,可以使用随机梯度上升法;(5)测试算法:训练完成,将数据投入模型进行测试;(6)使用算法:将需要的数据进行处理成适合模型的结构...

2018-07-27 10:14:39 10379

48道SQL练习题.pdf

SQL练习题,题目比较全,有简单和中等难度的题目。适合数据工作者。

2019-09-10

逻辑回归算法python实战(简单版)sklearn

这是个人学习逻辑回归时写的代码,主要时用的sklearn包。很简单的代码,只适合初学者。

2018-11-19

机器学习训练秘籍

吴恩达老师的课通俗易懂,是每一个学习机器学习的学者所知,而这本书是其他作者翻译,内容不错!

2018-11-16

Python编程导论

这是一本Python编程的书籍,内容不错,希望可以对你有好处。

2018-11-06

实用多元统计分析

本教材针对多元分析进行了很全面的讲解,包括多元线性回归。

2018-11-05

机器学习与R语言

这是一本将机器学习与R语言很好地结合实践的教材,希望可以帮到你。

2018-11-04

《机器学习实战》code

这是《机器学习实战》一书的数据和代码,希望可以帮助大家学习。

2018-07-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除