![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 78
苍狗白云一瞬间
这个作者很懒,什么都没留下…
展开
-
多线程查询ES返回结果
背景:现在人脸流水库有大概8W人脸数据需要提供给WEB组一个人脸检索接口(根据检索条件从ES中检索出相关数据 然后和传过来的人脸图片进行特征比对 筛选符合条件的数据 ):方案:根据上传的图片,已经相关查询条件:String place_id = json.getString("site_code");float start_time = json.getFloatValue("sta...原创 2019-11-26 09:57:17 · 2002 阅读 · 0 评论 -
数据化运营常见的数据预处理经验
数据清洗中,主要的处理是缺失值,异常值和重复值,所谓清洗,就是对数据集进行丢弃,填充,替换,去重等操作,实现去除异常,纠正错误,补足缺失的目的。 数据列缺失, 1.行记录缺失,数据丢失(通常无法找回) 2.数据列值缺失---------------------------------------------------- 这里主要说...转载 2018-10-08 10:48:58 · 254 阅读 · 0 评论 -
运营数据缺失值处理样例
import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputerdf=pd.DataFrame(np.random.rand(6,4),columns=["col1","col2","col3","col4"])df.iloc[1:2,1]=np.nandf.iloc[4,3]=np.nan...翻译 2018-10-08 17:35:27 · 206 阅读 · 0 评论 -
python数据分析 常用方法总结(持续更新)
raw_data=pd.read_table("E:/data/book/python_book/chapter6/products_sales.txt",delimiter=",")1.查看数据样例,raw_data.tail(2)) 或者 head2.查看数据概况 print(raw_data.describe().round(1).T) T 应该是转换行列的方法count...翻译 2018-09-30 10:29:05 · 1004 阅读 · 1 评论 -
订单,用户,商品关联分析记录
最近有做采购平台 订单,用户,商品关联分析 的任务目的在于希望能产出 商品推荐商品或者 商品 推荐给用户 的数据主要采用python的apriori 进行关联分析样例代码如下 大概如下:from apyori import aprioriimport pandas as pddef ResultDFToSave(rules): # 根据Qrange3关联分析生...原创 2018-10-31 14:13:51 · 3771 阅读 · 0 评论 -
针对采购品类的用户相似性分析
数据描述: 取三级品类采购数据的top的 品类品类 被采购次数办公文具 36677纸类 21236纸品/湿巾 20646文件管理 15909本册便签 13781充电器/数据线 10240打印复印耗材 9803食用油 8368米面杂粮 8143以这些品类为基础筛选了采购过这10个品类里面3个以上的用户采购品类数...原创 2018-11-02 17:31:25 · 235 阅读 · 0 评论