- 博客(9)
- 收藏
- 关注
原创 Linux数理描写
数理统计:1.描述统计2.推断统计1.描述统计1.什么是描述统计?描述统计 从数据中提取 变量的主要信息2.从数据中提取 变量的主要信息 =》 【指标】 统计量统计量: 1.频率与频数 2.集中趋势分析: 均值、中位数、众数、分位数 3.离散程度分析: 极差、方差、标准差 4.分布形状: 偏度、峰度3.提取 变量: 1.数值变量 【就是一个table 中的 column 是数值类型】 2.类别变量 【就是一个table 中的 column 是非数值类型 stri
2022-04-22 13:57:14
162
原创 Linux基本操作
基本命令:1.mv + cp1.mv 剪切2.cp 复制mv =》 文件个数 始终是1分 cp =》 文件个数 始终是2分1.移动 [root@sygy10 bigdata]# mv 1.log ../1.log [root@sygy10 bigdata]# cp ~/1.log ./2.改名字 [root@sygy10 ~]# mv 1.log 1.log_blk [root@sygy10 ~]# cp 1.log_blk 1.log标准写法: mv xx.log
2022-04-22 13:56:43
1223
原创 Linux基本操作
基本命令:1.mv + cp1.mv 剪切2.cp 复制mv =》 文件个数 始终是1分 cp =》 文件个数 始终是2分1.移动 [root@sygy10 bigdata]# mv 1.log ../1.log [root@sygy10 bigdata]# cp ~/1.log ./2.改名字 [root@sygy10 ~]# mv 1.log 1.log_blk [root@sygy10 ~]# cp 1.log_blk 1.log标准写法: mv xx.log
2022-04-22 13:55:47
357
原创 Linux
linux :1.概述1.为什么要使用linux ?java、前端、大数据、算法 =》 app 服务器 =》 linux2.2.linux 概述:1.文件操作系统:层级式的文件操作系统linux 最顶层目录:/3.linux版本: 广义 : ubuntu、小红帽、centos、debian、等 基于linux 内核进行开发 狭义:centos 6.x =》 7.x =》 7.5 4.学习linux ? 1.环境准备: 1.vmware (vb
2022-04-22 13:54:19
84
原创 数据处理切片
数据处理 :算子 map filter groupby apply数据切片pandas :1.官网https://pandas.pydata.org/2.概述:pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool,【pandas就是一个数据分析的工具】3.编程模型【数据类型】1.Series2.DataFrame1.Series1.
2022-04-22 13:45:05
151
原创 机器学习1
机器学习:1.概念Simple and efficient tools for predictive data analysis【预测数据分析结果】用机器代替人做决策数据集 =》 训练 =》 模型 2.Built on NumPy, SciPy, and matplotlib、pandas2.机器学习里面的常用术语 :1.数据集准备 色泽= 绿色 、根=弯曲 、 敲声 = 浑浊 =》 熟的 色泽= 黑色 、根=弯曲 、 敲声 = 沉闷 =》 生的 色泽= 红色 、根=弯曲
2022-04-22 13:41:38
81
原创 爬虫相关1
爬虫:1.百度百科2.自己理解:通过代码、模拟浏览器上网 然后抓取数据的过程2.爬虫是否合法?1.法律允许2.有法律风险的3.统一规定? 【法律界限】robots.txt协议4.爬虫的分类:1.获取一整张页面 【通用爬虫】2.获取一整张页面 部分数据 【聚焦爬虫】3.检查页面更新、获取页面最新的更新的数据 【增量式爬虫】5.爬虫的规则:1.反爬策略:门户网站 通过 技术手段 防止爬虫程序对页面爬取数据2.反 反爬策略爬虫程序 通过 技术手段 对页面爬取数据http 与ht
2022-04-22 13:40:40
434
原创 python函数
.函数:函数 =》方法 【区别不大】scala 【有区别】1.内置函数 【 常用类的api】 1.数学相关的 【math 包下的】2.自定义函数3.匿名函数【没有名字的函数】1.内置函数 【 常用类的api】print(abs(-10)) #绝对值print(max(1, 2, 3, 4, 5))print(min(1, 2, 3, 4))print(sum([1, 2, 3]))import mathprint(math.sqrt(16))print(math.ceil(
2022-04-22 13:39:17
66
原创 python
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2022-04-22 13:38:09
4208
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅