数据分析
Rp_
计算机科学与技术专业,正在学习数据挖掘方向,同时学习微服务后台内容,欢迎一起交流hhh
展开
-
pymongo 常用方法 $in 正则表达式等查询
pymongo 常用方法find排序 .sort().sort([("field1", pymongo.ASCENDING), ("field2", pymongo.DESCENDING)])ASCENDING = 升序DESCENDING = 降序限制查询个数 .limit().limit(10)注释:限制10条$in.find({“field”: {"$in": [“A”, “B”]}})正则表达式 reresult = a3col.find({"apis": {"$rege原创 2021-09-06 10:33:06 · 1448 阅读 · 0 评论 -
pymongo find $in 的使用 python mongodb
pymongo find $in 的使用 python mongodb笔者近日需要用到mongoDB的$in,查询了一下在Python中该如何查询:import pymongoclient = pymongo.MongoClient('host', 0000) # 0000 即IPdb = client.socoll = db.speciesCollectionresult = coll.find({"SPCOMNAME":{"$in":['paddlefish','lake sturgeo原创 2021-09-04 10:09:31 · 1622 阅读 · 0 评论 -
计算相关系数 皮尔逊相关系数 Pearson、Spearman
数据探索计算相关系数为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系统来进行相关分析。在二元变量的相关分析过程中比较常用的有Pearson相关系数,Spearman秩相关系数和判定系数。Pearson相关系数一般用于分析两个连续性变量之间的关系,其计算公式如下。r=∑i=1n(xi−x‾)(yi−y‾)∑i=1n(xi−x‾)2∑i=1n(yi−y‾)2r = {\su...原创 2019-04-06 20:22:53 · 8458 阅读 · 0 评论 -
Excel 实现类似 group by count 功能
Excel 实现类似 group by count 功能想知道数据里每一项分别出现多次,如果是在DB中,我们可以用 select count(*) from … group by … 这样的语句来处理,但是如果在Excel中的话该怎么实现呢?方法如下:1、复制一份数据备份先2、选择需要统计的数据,选择功能“数据”->“删除重复值”3、得到distinct的项4、格式刷5、...原创 2019-08-04 09:18:16 · 36946 阅读 · 0 评论 -
Python 实现 距离公式 欧式距离、余弦距离、曼哈顿距离
距离公式 python1、欧式距离(Euclidean Distance)计算公式:(x1−x2)2+(y1−y2)2\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}(x1−x2)2+(y1−y2)2Python# 计算欧氏距离def distEclud(vecA, vecB): return np.sqrt(np.sum(np.power((vecA...原创 2019-08-05 17:06:07 · 14598 阅读 · 1 评论 -
Python 实现 计算相关系数 皮尔逊相关系数 Pearson、Spearman
数据探索计算相关系数为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系统来进行相关分析。在二元变量的相关分析过程中比较常用的有Pearson相关系数,Spearman秩相关系数和判定系数。皮尔逊相关系数(Pearson Correlation Coefficient)一般用于分析两个连续性变量之间的关系,其计算公式如下。r=∑i=1n(xi−x‾)(yi−y‾)∑i=1n(x...原创 2019-08-05 19:19:51 · 9183 阅读 · 0 评论 -
Python 数据处理 缺失值处理
Python 数据处理 缺失值处理数据来源:https://forge.educoder.net/attachments/download/376915/input.zipdataframe 缺失值处理查看缺失值情况train.isnull().sum().sort_values(ascending = False)缺失值处理def solve_nan_str(data, co...原创 2019-08-17 19:20:09 · 1761 阅读 · 0 评论