![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 98
F1F88
这个作者很懒,什么都没留下…
展开
-
使用Numpy、Pandas、自编三种方法计算数据的集中趋势和分散趋势
实验一:计算数据的集中趋势和分散趋势一、实验目的学习 Numpy 库和 Pandas 库数据基本统计函数,研究库函数与自定义函数的区别。二、实验内容定义三个类(Numpy、Pandas、自编),类中编写数据基本统计方法。方法名与功能如下表2-1名称功能输入返回mean计算均值( 数据列表 )平均值tmean计算截尾均值( 数据列表 )截尾均值weight_mean计算加权平均数( 数据列表,权重列表 )加权平均数值median计算中位数原创 2021-04-24 19:15:01 · 2148 阅读 · 1 评论 -
宝可梦数据集分析及预测
摘要 本文利用基于 Python 平台的Numpy、Pandas、Matplotlib 以及机器学习算法库 scikit-learn,提供的有监督学习的机械学习算法 KNeighborsClassifier 分析模型,对1013只精灵宝可梦的数据集进行分析预测,通过对数据集的抽取,清洗,转换和 KNeighborsClassifie 模型的训练,最终将预测宝可梦是否属于 传奇宝可梦、神话宝可梦、超进化宝可梦三类。并通过搜索最优测试集占比,搜索最优超参数 k,原创 2021-04-02 19:57:57 · 5696 阅读 · 24 评论 -
Hadoop分布式平台安装教程
基于 Zookeeper、Hadoop、Hbase、Hive、Scala、Spark完全分布式平台搭建教程原创 2020-11-22 13:46:38 · 2625 阅读 · 3 评论