![](https://img-blog.csdnimg.cn/0d893a9260de4d688429f9a6f34bc752.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据挖掘
文章平均质量分 82
记录学习数据挖掘的笔记
游点
这个作者很懒,什么都没留下…
展开
-
Pandas 统计分析基础
groupby 方法使用的分组键除了 Series,也可以是其他的格式。DataFrame 数据的列索引名可以作为分组键,但需要注意的是用于分组的对象必须是 DataFrame 数据本身,否则搜索不到索引名称会报错。DataFrame 的基础属性有 values、index、columns、dtypes、ndim 和 shape,分别可以获取DataFrame的元素、索引、列名、类型、维度和形状。通过列索引标签或以属性的方式可以单独获取 DataFrame 的列数据,返回的数据为 Series 类型数据。原创 2024-01-06 17:42:16 · 936 阅读 · 1 评论 -
NumPy 数值运算基础
1. 创建数组对象Numpy是一个开源的 Python 科学计算库,它是 python 科学计算库的基础库,许多其他著名的库(如 Pandas 、Scikit-learn 等)都要用到 Numpy 库的一些功能。Numpy 常用的导入格式:import numpy as np1. 创建数组对象NumPy 库能将数据(列表、元组、数组或其他序列类型)转换为 ndarray 数组。原创 2024-01-06 15:14:44 · 942 阅读 · 1 评论 -
认识数据
非对称性属性( Asymmetric Attributes )基于图形的数据( graph - based data )有序数据( ordered data )记录数据( record data )连续属性( continuous )分辨率( resolution )属性( attributes )区间属性( interval )离散属性( discrete )数据集( data set )标称属性( nominal )序数属性( ordinal )二元属性( binary )比率属性( ratio )原创 2023-12-16 11:00:08 · 46 阅读 · 1 评论 -
数据挖掘简介
数据挖掘( Data Mining )是人工智能和数据库领域研究的热点问题,是指从大量有噪声的不完全的模糊和随机的数据中,提取出隐含在其中的、事先不知道但具有潜在利用价值的信息的过程。这个定义包括几层含义:数据必须是真实的、大量的并且含有噪声的。发现的是用户感兴趣的可以接受、理解和运用的知识。仅支持特定的问题,并不要求放之四海而皆准的知识。原创 2023-12-15 18:21:00 · 61 阅读 · 0 评论