- 博客(7)
- 收藏
- 关注
原创 Sklearn学习笔记
开发环境: Anacoda-jupyter 下载graphviz 一、sklearn的基本信息 官网:https://scikit-learn.org/stable/ 推荐书籍:《数据挖掘导论》《机器学习》又称西瓜书 sklearn分为六个板块,如下: 分类 回归 聚类 降维 模型选择 数据的预处理 二、决策树学习重点: 解决两个重要问题: 如何从数据表中找出最佳节点和最佳分支?
2022-01-09 14:52:33 841
原创 数据分析挖掘与建模(操作篇)
数据分析的大致步骤:数据收集——数据处理——数据分析——数据可视化做数据分析之前需要思考的问题: 查看数据的shape、Columns 分析想要数据之间的什么关系 一、加载数据读取文件:read_并将多个excel表格合并:concat();注意按照行拼接二、数据预处理:NA空缺值先查看所有的数值:info()删除掉空缺的值:dropna();注意是删除列,axis=1修改源数据:inpalce=True;意思是改变原来的值三、分析数据..
2021-12-25 17:16:53 1806
原创 Matplotlib和seaborn(四)
饼图/条形图/直方图/散点图1、如何解决乱码问题?plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False2、如何保存图片?可以保存为png、pdf等格式plt.savefig('C:\data\第四章\可视化.png')3、确保图形能够展现出来%matplotlib inline绘图基础语法(plot):title:是图表的标题名称ticks...
2021-12-25 14:10:37 850
原创 kaggle Zillow Prize 项目实战
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns一、读于csv数据,并查看数据train_df=pd.read_csv("./input/train_2016_v2.csv", parse_dates=["transactiondate"])train_df.shapeparse_dates:将交易日时间字符串转换成日期格式二、 绘制散点图pl..
2021-12-25 14:05:07 762
原创 Panda库知识点(三)
Pandas的基本介绍:左边是索引(index),右边是values(数据);pandas有两个最主要的数据结构:series和dataframe series可以保存任何数据类型:int、str、float...一、Series的创建1.1通过列表创建1.2 通过将numpy数组放在series中创建1.3通过字典创建二、Series的基本用法isnull是判断是否为空,空就是Truehead()默认前5行,()里是数字几,就是几行tail()默认后5行,()里是数字...
2021-12-01 15:39:11 702
原创 Numpy库知识点(二)
首先要导入numpy库import numpy as np一、数组的创建方法一:使用array来创建数组a=np.array([1,2,3,4])print(a)[1 2 3 4]方法二:使用np.arange来创建数组a=np.arange(0,10,2)aarray([0, 2, 4, 6, 8])方法三:使用np.random来创建N行N列的数组(0~1的随机数)a=np.random.random((2,2))aarray([[0.1352.
2021-12-01 14:58:45 1595
原创 Python基础知识(一)
一、变量和字符串:1.1 变量的命名 由字母、数字、下划线等字符及其组合构成 首字符不能是数字 ,且中间不能出现空格 1.2 字符串 什么是字符串 单引' ',或者双引" " 如何修改字符串大小写? .title()首字母大写 .upper()全都大写 .lower()全都小写 如何删除空白? .lstrip()清除字符串开头的空白 .rstrip()清除字符串结尾的空白 .strip()清除字符串所
2021-12-01 09:58:16 967
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人