pandas
坤坤子的世界
人之能,不仅在学,且在悟,悟之根本,不在少学,在难后重学,大难而有大悟,始得大成。
展开
-
向量与矩阵、矩阵与矩阵的余弦相似度计算(sklearn实现)
关于的余弦相似度公式,这里就不再描述,直接看如何使用sklearn自带的工具计算余弦相似度,具体代码如下:1 向量和矩阵之间的余弦相似度计算向量和矩阵之间的余弦相似度时,其计算结果是向量和矩阵中的每一行计算结果的集合,注意最终结果为了方便查看,是越大越相似。1.1 使用dataframe代表的矩阵和向量#%%#矩阵,这里我用dataframe代替矩阵a = pd.DataFrame(np.array([[1,2],[3,4],[5,6],[7,8]]),columns=['x','y'原创 2022-02-15 10:59:57 · 2692 阅读 · 0 评论 -
机器学习之pandas急速入门初级
学习机器学习,最基本的就是用Python语言对数据进行基本操作,面对众多需要学习的知识,基本上学完就忘了,贼难受啦!!这不我本着我下地狱的精神,总结了一下,但愿众生别放弃,哈哈。pandas先来个整体目录感受一下:创建通过创建Series 通过传递numpy array创建元素 通过字典的结构进行创建,查看数据查看数据类型(.dtypes) 查看数据前或后几行数据(.h...原创 2019-08-09 11:10:50 · 472 阅读 · 0 评论 -
机器学习pandas之缺失值的处理方法
对于数据分析和分析人员来说,数据预处理的过程常常站用了大部分工作量,数据缺失值往往是不可避免要面对的问题,值得注意的是缺失值不仅仅是指那些数据中NULL值,也包括表示数据缺失的特殊数值。一般来说,对数据缺失值的有多种,可以用一个常值来填充,但这不是一个好方法,一般可以选择使用均值、中位数来填充会更好一些,还有其他方法,可根据实际情况选择对应的方法,如下总结(并给出相应的最常用的实现代码):...原创 2019-08-11 14:49:22 · 2528 阅读 · 0 评论