- 博客(31)
- 资源 (9)
- 收藏
- 关注
原创 笔试必备:48道SQL练习题(Oracle为主)
练习主要涉及四张表,分别如下:student(sid,sname,sage,ssex) 学生表course(cid,cname,tid) 课程表score(sid,cid,score) 成绩表teacher(tid,tname) 教师表首先建立表结构CREATE TABLE student ( sid INT, sname varcha...
2019-07-10 17:54:53 3036 2
原创 【Leetcode】——python实现
1.两数之和给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]answe...
2019-04-01 16:08:58 158
原创 经典算法(四):KNN
一、算法概述 KNN也称为K近邻或最近邻(nearest neighbor),从字面来理解就是根据测试样本相对最近(属性相对最近)的K个训练样本的类别来决定该测试样本的类别(少数服从多数)。KNN是一种惰性学习方法(不需要训练模型),主要处理分类问题。有惰性学习方法,那么也有积极学习方法,前面讲到的决策树是积极学习方法。那怎么判断属性相对最近呢?其实KNN算法在寻找相对最近样本时...
2019-03-30 16:46:12 836
原创 经典算法(三):决策树
一、决策树概念 在经典算法中,决策树是常用的算法之一。前面提到的线性回归可以解决回归问题,逻辑回归可以解决分类问题,而今天要学习的决策树不但可以回归问题,还可以解决分类问题。顾名思义,决策树分为两种树,回归树和分类树。在分类算法中,决策树是根基。现在常用的随机森林也是基于多个决策树集成的算法。从名称可以看出,决策树是含有分叉的树状算法。决策树思想是寻找最纯净的划分方法,...
2019-03-19 16:58:51 839
原创 经典算法(二):逻辑回归
目录 一、逻辑回归数学来源 二、极大似然法 三、逻辑回归算法过程 四、逻辑回归算法Python实战 一、逻辑回归数学来源 说到算法,我们首先想到的是线性回归和逻辑回归这两种基础算法,上一篇博文详细学习线性回归,我们都知道线性回归是回归算法,可以得到实值。而在名称上类似的逻辑回归虽然也有“回归”两个字,但是逻辑回归...
2018-11-19 16:46:52 404
原创 经典算法(一):线性回归
前言1. 基本形式2. 损失函数 2.1 损失函数 2.1.1 最小二乘法 2.1.2 极大似然估计 2.2正规方程法 2.2.1 一般形式 2.2.2 矩阵形式 2.3梯度下降法 2.3.1梯度下降法的代数方式描述 ...
2018-11-06 23:07:27 3492
原创 Python连接Oracle
Python连接Oracle数据库,由于python没有自带的模块可以解决该问题,需要借助其他模块,经常会出现问题,所以记载一下自己连接的过程,方便自己回看,也希望可以帮助到需要的人。一、下载安装cx_Oracle模块:1、直接下载:https://pypi.python.org/pypi/cx_Oracle2、通过命令行下载安装(推荐):二、Oracle instant cl...
2020-01-13 17:04:54 1447 3
原创 Python.matplotlib可视化
matplotlib是Python中可视化的模块,接下来将一点点学习可视化。持续更新。。。#导入模块import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline #Jupyter Notebook在线绘图语句,如果不添加该语句,图片无法显示#防止中文乱码plt.rc...
2019-09-18 14:46:17 230
原创 牛客网SQL练习
为了提升自己的SQL能力,决定认真刷题,先从牛客网开始。于是做一下刷题记录。1.查找最晚入职员工的所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NO...
2019-08-28 17:24:06 381
原创 python基础任务六(turtle画佩奇)
下面是用turtle画出小猪佩奇,使用turtle画图很有意思,有空再尝试其他图形。from turtle import*def nose(x,y):#鼻子 (公众号:数据分析联盟) penup()#提起笔 goto(x,y)#定位 pendown()#落笔,开始画 setheading(-30)#将乌龟的方向设置为to_angle/为数字(0-东、90-...
2019-04-10 20:44:45 345
原创 python基础任务五(文件、模块和正则表达式)
1.filea.打开文件方式(读写两种方式)open( )用于打开文件,可以设置打开文件的格式。#常用的参数有两个open(file,mode='r')#完整的语法open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)fi...
2019-04-09 20:42:00 252
原创 python基础任务四(函数)
1. 内置函数2. 函数的定义函数可以用于调用,方便,可以自定义。自定义函数的简单规则:函数代码块以def关键词开头,后接函数标识符名称和圆括号()。 任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。 函数内容以冒号起始,并且缩进。 return [表达式]结束函数,选择性地返回...
2019-04-06 15:31:59 272
原创 python基础任务三(字典、集合和条件结构)
一、字典1.创建字典字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 。dict1={key1:value1,key2:value2}键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。dict1={'me':23...
2019-04-04 17:43:32 321
原创 python基础任务二(字符串、列表和元组)
一、字符串1.创建字符串字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。创建字符串很简单,只要为变量分配一个值即可。var1='apple'var2='Hello World!'2.访问字符串中的值Python不支持单字符类型,单字符在 Python 中也是作为一个字符串使用。Python访问子字符串,可以使用方括号来截取字符串。...
2019-04-02 15:06:49 745
原创 python enumerate( )函数用法
一、enumerate( )函数说明1.enumerate()是python的内置函数2.enumerate在字典上是枚举、列举的意思3.对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值。(即可以将一个可遍历的数据对象组合为一个索引序列,同时列出数据和数据下标。)4.enumerate多用于在f...
2019-04-01 17:29:42 199
原创 python基础任务一(环境搭建和简单运算)
1. 环境搭建 a) anaconda环境配置anaconda可以在官网下载并安装,安装步骤较容易。安装完毕后需要配置环境变量,步骤如下:(1)首先找到anaconda的路径,并找到Scripts文件,双击进入(2)复制该文件的路径(3)右键单击“我的电脑”,选择“属性”,进入下图页面点击“高级系统设置”(4)点击“环境变量”(5)系统变量中找到“...
2019-03-31 11:39:12 315
原创 预测贷款用户是否逾期:数据清洗与预处理
任务一做一个项目的第一步是数据清洗与预处理,也是对数据进行探索和分析。这份数据集是金融数据,我们的目标是要预测贷款用户是否会逾期,其中status表示标签,1表示逾期,0表示未逾期。1.查看数据可以使用excel或者SPSS等分析软件打开文件进行查看,当然是数据量允许的情况下才能用excel打开,否则你的电脑会一直转圈圈。还有就是可以导入python查看,一般python导入数据使用的...
2019-03-04 09:07:39 1056
转载 特征选择
特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。1 特征重要性度量计算某个特征X的重要性时,具体步骤如下:1)对每一颗决策树,选择相应的袋外数据(out of bag,OOB)计算袋外数据误差,记为errOOB1.所谓袋外数据是指,每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,这时还有大约1/3的...
2019-02-19 16:27:42 214
原创 模型评估指标(分类模型、回归模型)
一、分类指标1.精确率(precision): (预测为正的里面预测对的概率)2.召回率(recall):(真实为正的里面预测对的概率)3.F1值: (对精确率和召回率赋不同权重进行加权调和)4.准确率(accuracy):5.错误率(error rate):6.ROC:绘制ROC曲线,首先对所有样本按预测概率排序,以每条样本的预测概率为阈值...
2019-01-26 14:48:52 1778
原创 python常用函数总结(一)
一、输入输出函数1、print()函数#输出指定的内容print('hello world')#可以同时输出多个字符串,用逗号‘,’隔开print('hello','how','are')#可以进行计算并输出结果;若对输出结果加上引号'',则不能进行计算,直接输出print(200+300)print('200+300')#使用‘+’将字符串连接,且不产生空格pri...
2019-01-16 16:41:23 474
原创 入门python代码系列:简单线性回归(二)
1.数据预处理数据预处理的详细请参考前一篇博文(数据清洗与预处理),这里简单带过。import numpy as npimport pandas as pdimport matplotlib.pyplot as plt #导入可视化模块data=pd.read_csv('E:/data/studentscores.csv')X=data.iloc[:,:1].valuesy...
2018-12-12 15:22:54 517
原创 入门python代码系列:数据清洗与预处理(一)
对于刚接触机器学习或者数据分析的同学来说,看大佬们比赛的代码是很难的,一头雾水,都是看不懂的,心里很慌。所以对于初学者来说,还是需要回归简单,只有掌握基础,才能不断深入,我是深有体会的,不知道你感觉如何?接下来我将梳理一套针对初学者的代码系列,希望可以帮助大家也受益自己。1.导入需要的库import numpy as npimport pandas as pd2.导入...
2018-12-07 17:54:32 1751
原创 LogisticRegression在sklearn中的参数详解
LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', ver...
2018-12-06 16:07:44 4758
原创 一元线性回归VS多元线性回归
一元线性回归和多元线性回归表面意思容易理解,但是结合实际的数据集,会混乱。这也是在编写线性回归博文的时候梳理知识点发现自己的不足,同时记录下来,让有疑问的同学也可以得到答案,拨开乌云。1.在数据集上的异同一元线性回归:给定数据集,其中,样本有1个属性描述。VS多元线性回归:给定数据集,其中 ,,样本有d个属性描述。 2.向量表达式一元线性回归: ...
2018-11-10 21:25:40 4011
原创 线性回归的数学推导
线性回归是最基础的算法,同时也是其他高级算法的根基,下面就和大家一起进攻基础算法之线性回归。线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型,那模型的好坏关键在于真实值与预测值之间的差异 。一般表达式 向量表达式 ...
2018-10-26 10:00:04 479
原创 一元线性回归最小二乘法
这个推导过程虽然简单,但是偶尔会犯错,一点的失误会造成耗费大量时间。其实,这过程是根据损失函数,对w和b进行求导,解方程组,则可以得到w和b。下面详细讲解该过程。 损失函数 求该式子的最小值,需要对它进行求导 ...
2018-10-13 14:17:18 2910
原创 将Excel、TXT文件通过MySQL workbench导入到数据库
导入Excel文件的步骤:1.先将Excel文件另存为以逗号分隔的csv格式,可用记事本打开确认是否是以逗号为分隔符;2.打开workbench,右键要插入的数据库,选择Table Data Import Wizard3.导入文件,next4.如果数据库中存在该表,则勾选图中红色数字1的圆圈;如果想重新创建表,则勾选图中红色数字2的圆圈,为了防止存在该表出现错误,建议勾...
2018-09-21 15:17:36 9260 2
原创 Oracle SQL developer 几点常见的错误
1. Oracle查询时出现‘ORA-00911:无效字符’。该错误说明查询语句中存在中文字符,只需要改正即可。2. Oracle中的分组函数 group by 使用与MySQL有所不同在Oracle中Group by 分组时select后面提取的字段要有队分组列进行聚合的函数(count()、sum()等),否则会出错。 例如:select * from student gr...
2018-09-20 15:50:53 624
原创 Logistic回归的一般步骤
(1)收集数据:采用各种方法收集数据,比如爬虫等;(2)准备数据:因为需要计算距离,所以数据类型应该是数值型,最好是结构化数据格式;(3)分析数据:通过业务的角度或者其他的方法分析数据;(4)训练算法:这是关键的一步,训练的目的是找到最佳的分类回归系数,可以使用随机梯度上升法;(5)测试算法:训练完成,将数据投入模型进行测试;(6)使用算法:将需要的数据进行处理成适合模型的结构...
2018-07-27 10:14:39 10477
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人