- 博客(4)
- 收藏
- 关注
转载 数据聚类
1相似度分析相似性度量准则是聚类分析用来度量数据之间差异化的一个重要标准。聚类分析中数据之间相似程度较大,需要按照某种聚类准则进行分离数据。在这样的一个过程中,需要使用相似性度量来衡量数据之间的相似及不同。在相似性度量中,距离度量是最常使用的一个准则,用来衡量数据之间的差异性,一般而言,距离越近的数据相似性越高,距离越远的数据相似性越低。(1)绝对值距离(2)欧氏距离...
2018-11-25 15:45:28 1981
转载 python中loc和iloc
1.loc意义:通过行标签索引行数据 例: loc[n]表示索引的是第n行(index 是整数) loc[‘d’]表示索引的是第’d’行(index 是字符) 2. .iloc :通过行号获取行数据,不能是字符 3. ix——结合前两种的混合索引三者区别: ix / loc 可以通过行号和行标签进行索引,比如 df.loc...
2018-11-23 15:18:58 11280
转载 pandas的使用
pandas时一个快元的python项目。最重要的两个数据结构:DataFrame和SeriesDataFrameDataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,...
2018-11-23 14:01:20 212
原创 NumPy的使用
numpy库引用 操作对象包括矩阵和数组:numpy.arange(n) 创建数组0,1,2,3...n-1numpy.arange(0,n,m) 0-----n-1间隔为m的数组numpy.linspace(0,n,m) 0-----n-1的m个数组numpy.mat('[1 2;3 4]') 创建矩阵,注意引号numpy.ar...
2018-11-22 20:43:19 271
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人