自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Mysql 数据库基础——

数据库相关概念一、 数据库好处1、可以持久化数据到本地;2、结构化查询二、数据库的常见概念1、DB:数据库,存储数据的容器2、DBMS: 数据库管理系统,又称为数据库软件或数据库产品,用于创建或管理DB3、SQL: 结构化查询语言,有用数据库通信的语言,不是某个数据库软件特有的,而是几乎所有主流数据库软件通用语言三、 数据库寻出数据的特点1、数据存放到表中,然后表再放到...

2019-12-11 18:26:59 140

原创 while循环——python实现

while循环-python实现练习题:1、一个计数变量 count 来记录用户输入次数,它的初值应该是0;2、使用 while 循环实现用户多次输入密码的功能;3、正确的用户名为 “小象学院” ,密码是 “python666”4、当输入用户名和密码都正确的时候,提示 开门成功,欢迎回家 ,然后退出循环;否则 count 加1且做出相应提示;当计数变量 count == 3 时,提示 机...

2019-11-26 16:04:04 500

原创 Mysql 日期时间函数

Mysql 日期时间函数datetime和timestamp区别:timestamp类型字段特殊性:Mysql获取日期时间函数:— now()—curdate()—curtime()—Extract()—last_day()Mysql日期时间计算函数:—date_add()—date_sub()—datediff(),timediff()—str_to_date()—...

2019-09-27 17:28:10 237

原创 task6:模型融合

数据挖掘–模型融合介绍:模型融合通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起。具体内容包括以下几个方面:1、Voting2、Averaging3、Ranking4、Bagging5、Boosting6、Stacking7、Blendingfrom sklearn.model_selection imp...

2019-08-18 22:40:04 163

原创 task5:调参

任务5:使用网格搜索法对5个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果。import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear...

2019-08-16 10:58:06 126

原创 数据挖掘-任务4:

任务4 - 模型评估(2天)记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格import numpy as npimport pandas as pddata=pd.read_csv(r'/Users/dongxiaojie/Documents/广东1810成绩/data2.cs...

2019-08-13 22:03:42 143

原创 数据挖掘实战(二):特征工程

一、特征衍生二、特征选择利用IV值做特征选择2.1 WOE2.2 IV一 特征衍生:利用个人(专家)经验来提取出数据里对结果影响更大的特征,往往是原有数据特征字段通过加减乘除等操作生成新的字段,这些字段在结合一些线性算法做训练的时候往往能起到提升模型效果的作用。举例,用户点外卖,同一家店A,统计一个星期内用户在这家店的购买次数,甚至统计一个月时间范围内,这样的时间周期特征就可以被...

2019-08-08 19:49:47 532

原创 数据挖掘 任务一:预测贷款是否逾期

目录步骤:1.数据导入;2.基本属性:(1)查看前10行;(2)查看数据大小,几行几列;(3)数据标签的分布情况;(4)数据的特征(列名);(5)每个分类变量中存在几个类别;(6)连续变量的均值、中位数等;(7)缺失值的处理;(8)分类变量热编码;(9)时间字段处理:(10)构建单个不同模型。import numpy as npimport pandas as pd...

2019-08-06 21:57:01 596

原创 《利用 python 进行数据分析》第七章 练习

7.1 处理缺失值import pandas as pdimport numpy as npstring_data=pd.Series(['one','two',np.nan,'four'])string_data0 one1 two2 NaN3 fourdtype: objectstring_data.isnull()0 Fals...

2019-07-03 00:16:44 317

原创 作业1

作业11.1 Arraysimport numpy as npimport pandas as pda=np.array([1,2,4,6,5])aarray([1, 2, 4, 6, 5])a.size #数组的大小(元素个数)5a.shape #几行几列?(5,)1.2 创建Arraynumpy 提供内置函数创建一些特殊数据np.zeros(3) #创...

2019-06-24 07:57:34 77

转载 anaconda 的python3.7 切换为python3.6

anaconda 的python3.7 切换为python3.6cmd使用命令:conda create -n py36 python=3.6 anaconda几秒后提示需要安装一些依赖库,输入y等待安装python3.6吧。安装好后,界面会有提示:To activate this environment, use:#source activate py36#To deacti...

2019-04-24 06:23:09 6728

原创 【Mysql】基础 3

mysql实战【项目】七:各部门工资最高的员工(难度:中等)创建 Employee 表,包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。±—±------±-------±-------------+| Id | Name | Salary | DepartmentId |±—±------±-------±-------------+|...

2019-04-06 20:43:37 152

原创 【Mysql】基础day2

项目三1、分组条件过滤&去重设置 :group & 子查询构建一个course表:sql语句:create table courses ( student char(20) NOT NULL ,class char(50) NOT NULL);insert into courses values('A','Math'),('B','Engish'),(...

2019-04-04 19:12:30 235

原创 【Mysql】基础 day1

【mysql】基础 day1:本次任务用workbench完成,但是莫名其妙的在家用mac系统无法导入数据,貌似是编码问题。。。如果有大神知道,为什么windows打开畅通无阻mac打开就悲伤逆流成河,,求告知!!感激不尽!!(浪费了2h,放弃)项目一:选择特定条件下有重复数据的信息(where)选择重复的电子邮箱:select distinct a.email from email a...

2019-04-02 20:38:53 83

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除