grow_up_-CSDN博客

转载乱序排列数据框DataFrame中行

通过DataFrame的reindex方法实现改变行的排序。但是通过这种方法只能实现特定方式的排序，并不能任意打乱，要实现随机任意排序，还需要借助numpy中的 random.permutation 函数。import numpy as npcities = cities.reindex(np.random.permutation(cities.index))通过上面的命令只是输出了乱序之后的中间数据框，并非cities本身，要实现彻底改变cities本身的行排序，不要忘记还需要将乱序后的中间Data

2020-06-16 11:17:37 788

原创数组类型array——输出

数组类型只能按行输出，不能按列输出

2020-06-14 18:14:39 799

转载 numpy中的argsort()函数

argsort()函数，是numpy库中的函数，其返回的是从大到小排序后的索引列表，输入可以为列表输入还可以为数组类型，输出结果都为数组类型，还可以按行列排序还可以降序排列输出，降序排列输入只能为数组类型，要用以下方式输出排好序的数，输入只能为一维数组...

2020-06-14 17:57:40 607 1

转载 Python enumerate() 函数

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标，一般用在 for 循环当中。

2020-06-13 17:48:06 184

转载数据预处理——加载数据及查看数据

加载数据path='*****.csv'df_train = pd.read_csv(path)查看数据data.head(5) #显示前5行数据data.tail(5) #显示后5行data.columns #查看列名data.info() #查看各字段的信息data.shape #查看数据集行列分布，几行几列data.describe() #查看数据的大体情况print(data.describe())###统计每列数据的缺失值，并从多到

2020-06-13 17:22:26 842

原创数据预处理——转化为DataFrame形式

iris.data是array型数据iris.target为list型数据import pandas as pdfrom sklearn.datasets import load_irisiris=load_iris()x=iris.datay=iris.targetdata=pd.DataFrame(x,columns=['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm'])labels=pd.DataFrame

2020-06-13 17:01:20 10219

原创贝叶斯网实例

贝叶斯网的两种实现方式(以泰坦尼克号数据集为例)：1.基于评分搜索的贝叶斯网络2.基于条件独立性测试的贝叶斯网络结构’port pandas as pdfrom pgmpy.estimators import HillClimbSearchfrom pgmpy.models import BayesianModelfrom pgmpy.estimators import BicScorefrom pgmpy.estimators import BayesianEstimatorimport

2020-06-13 10:23:56 1570