- 博客(8)
- 收藏
- 关注
转载 乱序排列数据框DataFrame中行
通过DataFrame的reindex方法实现改变行的排序。但是通过这种方法只能实现特定方式的排序,并不能任意打乱,要实现随机任意排序,还需要借助numpy中的 random.permutation 函数。import numpy as npcities = cities.reindex(np.random.permutation(cities.index))通过上面的命令只是输出了乱序之后的中间数据框,并非cities本身,要实现彻底改变cities本身的行排序,不要忘记还需要将乱序后的中间Data
2020-06-16 11:17:37
732
转载 numpy中的argsort()函数
argsort()函数,是numpy库中的函数,其返回的是从大到小排序后的索引列表,输入可以为列表输入还可以为数组类型,输出结果都为数组类型,还可以按行列排序还可以降序排列输出,降序排列输入只能为数组类型,要用以下方式输出排好序的数,输入只能为一维数组...
2020-06-14 17:57:40
530
1
转载 Python enumerate() 函数
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
2020-06-13 17:48:06
127
转载 数据预处理——加载数据及查看数据
加载数据path='*****.csv'df_train = pd.read_csv(path)查看数据data.head(5) #显示前5行数据data.tail(5) #显示后5行data.columns #查看列名data.info() #查看各字段的信息data.shape #查看数据集行列分布,几行几列data.describe() #查看数据的大体情况print(data.describe())###统计每列数据的缺失值,并从多到
2020-06-13 17:22:26
738
原创 数据预处理——转化为DataFrame形式
iris.data是array型数据iris.target为list型数据import pandas as pdfrom sklearn.datasets import load_irisiris=load_iris()x=iris.datay=iris.targetdata=pd.DataFrame(x,columns=['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm'])labels=pd.DataFrame
2020-06-13 17:01:20
10119
原创 贝叶斯网实例
贝叶斯网的两种实现方式(以泰坦尼克号数据集为例):1.基于评分搜索的贝叶斯网络2.基于条件独立性测试的贝叶斯网络结构’port pandas as pdfrom pgmpy.estimators import HillClimbSearchfrom pgmpy.models import BayesianModelfrom pgmpy.estimators import BicScorefrom pgmpy.estimators import BayesianEstimatorimport
2020-06-13 10:23:56
1405
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人