m0_47980281-CSDN博客

原创 linux虚拟机安装数据库

linux模板机：1. ip 动态ip =》静态ip1.内网2.学习方便2.关闭防火墙：1-65535关闭防火墙3.额外的安装包：1.jdk =》卸载掉2.mysql =》 mysql自带的额外包【安装mysql 去掉就行】【superset mysql自带的额外包】ip：1.win =》 vmware ：1.子网ip 1-255192.168.10.02.网关192.168.10.22.linux => 静态ip IPADDR=192.168.10.10

2022-04-15 23:09:42 1602

原创 shell语法入门

shell ：1.什么是shell ？脚本语言 python 1.一个编程的语言 2.可以执行的文件 3.文件内容 linux命令组成的1.shell语法入门1.入门1.文件 xxx.sh 结尾2.第一行 #!/bin/bash1.编写脚本 vim wc.sh2.得有执行权限【不一定】 1.不给文件权限 sh xxx.sh [root@zwd05 shell]# sh ./wc.sh word count [root@zwd05 shell]# cat wc.

2022-04-15 23:07:26 201

原创数理统计基本概念

数理统计：1.描述统计2.推断统计1.描述统计1.什么是描述统计？描述统计从数据中提取变量的主要信息2.从数据中提取变量的主要信息 =》【指标】统计量统计量： 1.频率与频数 2.集中趋势分析：均值、中位数、众数、分位数 3.离散程度分析：极差、方差、标准差 4.分布形状：偏度、峰度3.提取变量： 1.数值变量【就是一个table 中的 column 是数值类型】 2.类别变量【就是一个table 中的 column 是非数值类型 stri

2022-04-15 22:50:45 184

原创 Linux基本概念及基本命令

Linux基本命令基本命令：1.mv + cp1.mv 剪切2.cp 复制mv =》文件个数始终是1分 cp =》文件个数始终是2分1.移动 [root@sygy10 bigdata]# mv 1.log ../1.log [root@sygy10 bigdata]# cp ~/1.log ./2.改名字 [root@sygy10 ~]# mv 1.log 1.log_blk [root@sygy10 ~]# cp 1.log_blk 1.log标准写法：

2022-04-15 22:47:51 157

原创数据探索与数据预处理初步概念

数据探索+ 数据预处理数据探索：1.统计量分析：1.集中趋势的度量：1.均值、中位数、众数2.离散趋势的度量：极值()极差标准差、方差四分位数间距2.相关性分析：通过散点图获取相关系数数据预处理：补充：数据透视表也可以对数据进行分析【聚合统计】group by +agg案例：客户价值分析（用户画像 =》类似）1.基本理论：1.RFM模型2.聚类分析（机器学习里面的算法 =》结果标签）3.RFM聚类分析1.RFM模型 =》获取 RFM

2022-04-15 22:46:14 183

原创 pandas实现一布多表，一表多线

import matplotlib.pyplot as pltfrom pandas import Seriesdata = Series([1.47,1.62,1.78,1.94,2.38,2.60],index=[‘2012’,‘2013’,‘2014’,‘2015’,‘2016’,‘2017’])#实例化fig1对象fig2=plt.figure(figsize=(8,8),facecolor=‘w’)#实例化ax对象ax4 = fig2.add_subplot(2,2,1)ax5 =

2022-04-08 22:48:18 410

原创机器学习概述

机器学习：1.概念Simple and efficient tools for predictive data analysis【预测数据分析结果】用机器代替人做决策数据集 =》训练 =》模型 2.Built on NumPy, SciPy, and matplotlib、pandas2.机器学习里面的常用术语：1.数据集准备色泽= 绿色、根=弯曲、敲声 = 浑浊 =》熟的色泽= 黑色、根=弯曲、敲声 = 沉闷 =》生的色泽= 红色、根=弯曲

2022-04-07 21:43:06 81

原创 python爬虫

Python:1.概述：1.语言2.开发起来简洁 =》 java2.使用场景：1.数据分析 =》 numpy 、pandas2.web 开发 =》用的不多、百度3.游戏开发 =》用的不多4.AI （机器学习、深度学习）5.爬虫1.部署安装：1.安装： 1.python 原生的安装包 www.python.org 2.anaconda 安装 =》 1.python 有的 2.有一些丰富的第三方库 anaconda： 1.下载安装包 2.安装 =》

2022-04-07 21:39:40 52

m0_47980281的博客