自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 linux虚拟机安装数据库

linux模板机:1. ip 动态ip =》静态ip1.内网2.学习方便2.关闭防火墙 :1-65535关闭防火墙3.额外的安装包 :1.jdk =》 卸载掉2.mysql =》 mysql自带的额外包【安装mysql 去掉就行】 【superset mysql自带的额外包】ip:1.win =》 vmware :1.子网ip 1-255192.168.10.02.网关192.168.10.22.linux => 静态ip IPADDR=192.168.10.10

2022-04-15 23:09:42 1591

原创 shell语法入门

shell :1.什么是shell ? 脚本语言 python 1.一个编程的语言 2.可以执行的文件 3.文件内容 linux命令组成的1.shell语法入门1.入门1.文件 xxx.sh 结尾2.第一行 #!/bin/bash1.编写脚本 vim wc.sh2.得有执行权限【不一定】 1.不给文件权限 sh xxx.sh [root@zwd05 shell]# sh ./wc.sh word count [root@zwd05 shell]# cat wc.

2022-04-15 23:07:26 196

原创 数理统计基本概念

数理统计:1.描述统计2.推断统计1.描述统计1.什么是描述统计?描述统计 从数据中提取 变量的主要信息2.从数据中提取 变量的主要信息 =》 【指标】 统计量统计量: 1.频率与频数 2.集中趋势分析: 均值、中位数、众数、分位数 3.离散程度分析: 极差、方差、标准差 4.分布形状: 偏度、峰度3.提取 变量: 1.数值变量 【就是一个table 中的 column 是数值类型】 2.类别变量 【就是一个table 中的 column 是非数值类型 stri

2022-04-15 22:50:45 160

原创 Linux基本概念及基本命令

Linux基本命令基本命令:1.mv + cp1.mv 剪切2.cp 复制mv =》 文件个数 始终是1分 cp =》 文件个数 始终是2分1.移动 [root@sygy10 bigdata]# mv 1.log ../1.log [root@sygy10 bigdata]# cp ~/1.log ./2.改名字 [root@sygy10 ~]# mv 1.log 1.log_blk [root@sygy10 ~]# cp 1.log_blk 1.log标准写法:

2022-04-15 22:47:51 147

原创 数据探索与数据预处理初步概念

数据探索+ 数据预处理数据探索:1.统计量分析 :1.集中趋势的度量:1.均值、中位数、众数2.离散趋势的度量:极值()极差标准差、方差四分位数间距2.相关性分析:通过散点图 获取 相关系数数据预处理:补充:数据透视表 也可以对数据 进行分析 【聚合统计 】group by +agg案例:客户价值分析(用户画像 =》 类似 )1.基本理论:1.RFM模型2.聚类分析 (机器学习里面的算法 =》 结果 标签)3.RFM聚类分析1.RFM模型 =》 获取 RFM

2022-04-15 22:46:14 173

原创 pandas实现一布多表,一表多线

import matplotlib.pyplot as pltfrom pandas import Seriesdata = Series([1.47,1.62,1.78,1.94,2.38,2.60],index=[‘2012’,‘2013’,‘2014’,‘2015’,‘2016’,‘2017’])#实例化fig1对象fig2=plt.figure(figsize=(8,8),facecolor=‘w’)#实例化ax对象ax4 = fig2.add_subplot(2,2,1)ax5 =

2022-04-08 22:48:18 402

原创 机器学习概述

机器学习:1.概念Simple and efficient tools for predictive data analysis【预测数据分析结果】用机器代替人做决策数据集 =》 训练 =》 模型 2.Built on NumPy, SciPy, and matplotlib、pandas2.机器学习里面的常用术语 :1.数据集准备 色泽= 绿色 、根=弯曲 、 敲声 = 浑浊 =》 熟的 色泽= 黑色 、根=弯曲 、 敲声 = 沉闷 =》 生的 色泽= 红色 、根=弯曲

2022-04-07 21:43:06 74

原创 python爬虫

Python:1.概述:1.语言2.开发起来简洁 =》 java2.使用场景:1.数据分析 =》 numpy 、pandas2.web 开发 =》 用的不多 、 百度3.游戏开发 =》 用的不多4.AI (机器学习、深度学习)5.爬虫1.部署安装:1.安装: 1.python 原生的安装包 www.python.org 2.anaconda 安装 =》 1.python 有的 2.有一些丰富的第三方库 anaconda: 1.下载安装包 2.安装 =》

2022-04-07 21:39:40 46

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除