自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 机器学习------决策树------泰坦尼克号生存案例

决策树是一种基本的分类方法,当然也可以用于回归,我们一般只讨论用于分类的决策树。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,他可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或则条规则所覆盖。通常决策树学习包括三个步骤:特征选择,决策树的生成和决策树的修剪优点:计算复杂度不高,输出结果用于理解,对中间值的缺失不敏感,可以处理逻辑回归等不能解决...

2020-04-26 19:28:22 1371 1

原创 Python中pandas透视表pivot_table功能详解

原文链接一文看懂pandas的透视表pivot_table一、概述1.1 什么是透视表?透视表是一种可以对数据动态排布并且分类汇总的表格格式。或许大多数人都在Excel使用过数据透视表,也体会到它的强大功能,而在pandas中它被称作pivot_table。1.2 为什么要使用pivot_table?灵活性高,可以随意定制你的分析计算要求脉络清晰易于理解数据操作性强,报表神器二、...

2020-04-26 19:23:55 1977

原创 机器学习------特征工程CountVectorizer,DictVectorizer,TfidfVectorizer

特征工程是什么?特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性特征抽取对文本等数据进行特征值化 特征值化是为了计算机更好的去理解数据**from sklearn.feature_extraction.text import CountVectorizer#实例化vector=CountVectorizer()#调用fit_trans...

2020-04-11 21:54:23 428

原创 线性回归------正规方程,梯度下降,岭回归

定义:线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合比如y=kx+b模型 已知x求k和b的值 然后再根据x值求y的值。案例:这里有2010–2019年的房价的数据。这数据年度数据叫做x,然后求2020年的房价 这时候你已经知道了k和b,然后把x带入公式之中就可以求2020年的了,这就是预测。求解K值的方法:(1)正规...

2020-04-09 21:16:12 778

原创 Pyecharts手把手教你做动态可视化---收藏好喽!!!

案例一:from pyecharts.charts import Barfrom pyecharts import options as opts# 示例数据cate = ['Apple', 'Huawei', 'Xiaomi', 'Oppo', 'Vivo', 'Meizu']data1 = [123, 153, 89, 107, 98, 23]data2 = [56, 77, 9...

2020-04-06 19:23:11 2487 1

原创 mysq的查询练习题以及分析方法

1.查找最晚入职员工的所有信息select * from employees where last_name='Kalloufi';2.查找入职员工时间排名倒数第三的员工所有信息select *from employees order by hire_date desc limit 2,1;3.查找当前薪水详情以及部门编号dept_noselect s.*,d.dept_no ...

2020-03-28 09:28:09 430

原创 数据分析案例--学生用户消费分析

1.导入相关python包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom datetime import datetimeplt.style.use('ggplot')df=pd.read_csv(r'H:\阿里云\py学生用户消费分析\7_con...

2020-03-17 20:31:05 4077 9

原创 数据分析案例--淘宝用户行为分析

一、项目背景对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析和用户价值RFM分布二、数据来源https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1三、提出问题1.日PV有多少2.日UV有多少3.付费率情况如何4.复购率是多少...

2020-03-15 20:17:39 7106 2

原创 数据分析项目实战一【缺失值和异常值的处理】

1.导入相关python包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inline#导入缺失数值图像展示的包import missingno as msno2.读取数据data=pd.read_csv(r'H:\阿里云\泰坦尼克号\train.csv')data_...

2020-03-15 11:21:14 1022

原创 数据分析案例--个人收入水平分析

1.导入数据,查看数据import matplotlib.pyplot as pltimport pandas as pdimport numpy as npdata=pd.read_csv(r'H:\阿里云\个人收入水平调查分析\个人收入水平调查分析.csv')data.head()这里只查看前五行数据2.查看数据的相关性data.describe()2.1查看数据的整体...

2020-03-14 20:51:32 2543 1

原创 数据分析案例--泰坦尼克号分析

1.数据读取及查看1.1查看excel中的数据1.2用pandas查看这个数据import numpy as npimport pandas as pdimport matplotlib.pyplot as plt %matplotlib inlinedata=pd.read_csv(r'H:\阿里云\泰坦尼克号\test.csv')data1=pd.read_csv(r'H:\...

2020-03-14 12:05:37 2452

原创 mysql创建数据库,创建数据表,并且插入数据

1.创创建数据库create database python_test_1 charset=utf8;2.使用数据库 use python_test_1;3.创建数据表students,classesmysql> create table students( -> id int unsigned primary key auto_increment not ...

2020-03-13 23:36:59 10935

原创 mysql中的数据类型

char和varchar :汉字占两个字节 英文,数字或者是字符占一个字节列:性别:男 女char(2) 或者varchar(2)因为是汉字占两个字节 所以为2 这就是非unicode编码nchar和nvarchar:无论是汉字还是英文,数字或字符都占一个字符列如:性别:男 女nchar(1)或者nvarchar(1) 因为它是unicode编码所以是1 占用一个字节...

2020-03-13 23:28:45 395

原创 mysql查看数据库信息常用命令

1.查看所有数据库show databases;如图:2.查看当前使用的数据库select database();如图:3.查看数据库使用端口show variables like 'port';如图:4.查看数据库编码show variables like 'character%';如图:character_set_client 为客户端编码方式...

2020-03-13 23:27:30 33724

原创 数据分析案例--红酒数据集分析

介绍:这篇文章主分析了红酒的通用数据集,这个数据集一共有1600个样本,11个红酒的理化性质,以及红酒的品质(评分从0到10)。这里主要用python进行分析,主要内容分为:单变量,双变量,和多变量分析。注意:我们在分析数据之前,一定要先了解数据。1.导入python中相关的库import numpy as npimport pandas as pdimport matplotlib....

2020-03-13 12:04:05 23516

原创 数据分析案例--2012美国总统竞选赞助数据分析

美国总统竞选赞助数据分析本文来自阿里云天池实验室,案例原地址自学数据分析的小王同学借鉴一下,自己写一遍,分析一遍,自己做的代码和结果如下1.导入相关的python数据分析的库import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inline2.数据载入和总览2.1由于单个数...

2020-03-12 20:20:39 1527

原创 链家二手房爬取保存到excel中

​今天呢,我来爬取一下链家,拿到一些数据,方便后面进行数据分析。首先,打开主页:观察网页信息,发现不是Ajax请求,就是一个简单的获取就行了。我们开始办事情:可以看到,这段信息在源码中是这样的。请求状态码是200,证明请求成功了。我们现在来获取数据已经把数据爬取下来了。我们要把图上的数据都爬取下来,保存到本地代码走:import requestsfrom lxml ...

2020-03-10 21:00:21 1136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除