自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Linux基础语句使用

文章目录概要一、linux文件夹结构二、linux文件系统三、绝对路径和相对路径四、linux常用的命令命令行快捷键文件类型文件和文件夹管理的命令系统命令文本内容编辑文本内容的查看文件管理之查找文件的上传下载输出重定向文件的打包压缩系统常用命令概要[root@localhost ~] root代表当前登录用户 localhost主机名 ~当前所在的目录 1. ls 查看文件夹下有什么文件(只显示文件名称) ls -l /etc/ == ll /etc/ 以长列表的方式显示文件夹下的

2021-03-18 05:13:36 349

原创 MySQL数据库学习笔记

文章目录数据库分类mysql目录结构启动系统服务MySQL的重要概念简单的SQL操作设置密码忘记密码配置文件***基本语句*存储引擎MySQL中的数据类型浮点型字符类型*严格模式时间类型枚举与集合类型补充创建表的完整语法约束条件和主键外键一对多外键字段的约束级联更新级联删除多对多表关系判读 一对一表关系总结修改表的SQL语句补充复制表(了解)单表查询***查询语句的书写顺序和执行顺序查询关键字之where(筛选)查询关键字之group by(分组)查询关键之having(过滤)查询关键字之distinct

2021-03-15 23:30:35 289

原创 数据清洗操作 学习笔记

文章目录简单数据处理列字段处理重复值处理异常值处理缺失值处理出发地缺失值处理目的地缺失值处理文本处理操作excel表格模块openpyxl创建文件及工作簿写入数据读数据导入模块import numpy as npimport pandas as pdimport matplotlib.pyplot as plt导入数据集df = pr.read_csv('qunar_freetrip.csv' , index_col=0)df.head() #简单查看df.shape #查看数据形状,13

2021-03-13 04:42:52 460

原创 Pandas简单使用教程笔记

文章目录数据结构Series缺失值概念缺失值处理布尔选择器索引数据处理基本算术运算数据结构之DataFrameDataFrame常用方法数据读取方式1案例数据读取方式2数据读取方式3数据概览行列操作数据筛选数据处理缺失值处理数据汇总分组与聚合练习数据的纵向合并(添加数据项)数据的横向合并(链表操作)pandas,python+data+analysis的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。

2021-03-12 03:52:37 254

原创 numpy简单使用

文章目录数组numpy中的数据类型常用方法创建方式索引、切片花间索引(间断索引)布尔索引(逻辑索引)运算符数学函数 对数组数据进行数学函数运算***统计函数 √随机数模块# 身高height = [170,173,178,180,183]# 体重weight = [76,65,70,77,75]'''求BMI指数:身体质量指数=体重(KG)/身高(m)的平方'''# 这道题如果你真的想用python实现会稍微复杂一点data_list = []for i in range(5):

2021-03-12 01:30:55 194

原创 数据清洗操作基础 - jupyter

文章目录数据概览行列操作数据筛选数据处理缺失值处理数据汇总分组与聚合分组与聚合练习题数据的纵向合并(添加数据项)数据的横向合并(链表操作)数据概览df = pd.read_csv(r'sec_cars.csv')# 1.查看表格的前N条数据df.head(5) # 不写默认也是五条# 2.查看表格的后N条数据df.tail(5) # 不写默认也是五条# 3.查看表的行列df.shape # 结果是一个元组(行数,列数)# 4.获取表中所有的列名称df.columns# 5.获取表

2021-03-11 22:38:14 3908

原创 matlibplot绘图笔记

文章目录饼图的绘制条形图的绘制直方图的绘制箱线图折线图多条折线图散点图的绘制气泡图的绘制热力图的绘制补充组合图形的绘制饼图的绘制饼图属于最传统的统计图形之一,几乎随处可见,例如大型公司的屏幕墙、各种年度论坛的演示稿以及各大媒体发布的数据统计报告等;饼图是将一个圆分割成不同大小的楔(扇)形,而圆中的每一个楔形代表了不同的类别值,通常根据楔形的面积大小来判断类别值的差异;pie(x, explode=None, labels=None, colors=None, autopct=None, pctdi

2021-03-10 04:03:12 306 1

原创 数据分析中的常用数学模型实战教程笔记(下)

文章目录SVM模型代码操作手写体字母识别用最佳参数做预测使用默认参数做预测森林火灾可能性预测Kmeans-K均值聚类模型随机一个三组二元正态分布随机数拐点法轮廓系数法函数代码花瓣分类球员定位分类DBSCAN聚类模型(密度聚类)函数代码K均值和DBSCAN聚类区别各个省份出生率死亡率GDBTSVM模型支持向量机(Support Vector Machine, SVM)是一类按监督学习方式对数据进行*二元分类*的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyp

2021-03-10 00:25:44 972

原创 数据分析中的常用数学模型实战教程笔记(上)

一元线性回归如果需要查找两个变量之间是否存在线性关系 1.散点图 散点图只能反映出两个变量之间是否存在线性关系 并不能直接断定两个变量没有关系(还可能存在非线性关系) 2.公式计算 利用线性计算公式推导两个变量之间的关系 大于0.8说明两个变量存在明显的线性关系 大于0.5小于0.8说明两个变量存在线性关系 大于0.3小于0.5说明两个变量可能存在线性关系 小于0.3说明两个变量之间不存在线性关系

2021-03-07 18:54:39 1971

原创 jupyter notebook简单使用教程

文章目录jupyter notebook功能栏快捷键数据分析之Numpy下载导入模块numpy优势数组numpy中的数据类型补充常用方法创建方式索引与切片花式索引(间断索引)布尔值索引(逻辑索引)数学函数统计函数随机数模块赌场案例pandas简介下载与导入数据结构之Series缺失值的概念缺失数据处理布尔选择器索引数据处理基本算术运算数据结构之DataFrameDataFrame常用方法数据读取方式1配套案例数据读取方式2数据读取方式3jupyter notebook功能栏"""专业名词介绍 cel

2021-03-05 01:45:49 1957 2

原创 数据仓库

这里写自定义目录标题功能快捷键插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入数据仓库:诞生主要有两个原因 历史数据积存的需要 企业数据分析的需要热数据:使用频率较高的数据冷数据:使用频率较低的数据数据仓库特点:1.面向主题 1. **全新的界面设计** ,

2021-01-12 23:59:37 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除