- 博客(6)
- 收藏
- 关注
原创 【无标题】
数理统计: 1.描述统计 2.推断统计1.描述统计 1.什么是描述统计? 描述统计 从数据中提取 变量的主要信息 2.从数据中提取 变量的主要信息 =》 【指标】 统计量 统计量: 1.频率与频数 2.集中趋势分析: 均值、中位数、众数、分位数 3.离散程度分析: 极差、方差、标准差 4.分布形状: 偏度、峰...
2022-04-18 16:24:22
1433
原创 Linux 简述
linux :1.概述 1.为什么要使用linux ? java、前端、大数据、算法 =》 app 服务器 =》 linux 2. 2.linux 概述: 1.文件操作系统: 层级式的文件操作系统 linux 最顶层目录:/ 3.linux版本: 广义 : ubuntu、小红帽、centos、debian、等 基于linux 内...
2022-04-12 21:38:56
109
原创 Python简述
Python: 1.概述: 1.语言 2.开发起来简洁 =》 java 2.使用场景: 1.数据分析 =》 numpy 、pandas 2.web 开发 =》 用的不多 、 百度 3.游戏开发 =》 用的不多 4.AI (机器学习、深度学习) 5.爬虫 1.部署安装: 1.安装: 1.python 原生的安装包 www.pyt...
2022-04-07 20:28:48
427
原创 大数据专业各方面知识简述
大数据专业:面试:linux: tail -f F 区别hadoop: 读写流程、yarn、mapreduce【不会问的、shuffle】 hdfs: 小文件如何解决 nn ha yarn hahive: 1.sql 2.调优: 1.数据倾斜=》 join group by 2.使用过哪些参数flume:tail -f F ...
2022-04-07 20:27:37
1818
原创 爬虫相关知识
爬虫的框架:scrap :1.An open source and collaborative framework for extracting the data you need from websites.In a fast, simple, yet extensible way. 1.开源的爬虫框架 2.快速、简单、高效的方式2.安装部署3.基本使用 1.创建一个项目 scrapy startproject test_scrapy 1...
2022-04-07 20:26:21
42
原创 text two 4.7
数据处理 : 算子 map filter groupby apply数据切片pandas : 1.官网 https://pandas.pydata.org/ 2.概述: pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, 【pandas就是一个数据分析的工具】 3...
2022-04-07 20:07:55
88
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人