数据分析
文章平均质量分 66
你学狗狗叫
这个作者很懒,什么都没留下…
展开
-
互联网金融公司中的常用名词
通用名词名称含义原创 2020-08-16 11:35:55 · 421 阅读 · 0 评论 -
利用row_number () over(partition by order by)实现排名每个店铺中的销量前十的产品
在spark-sql实现排名每个店铺中的销量前十的商品这里主要用到的是窗体函数:rank()over(partition by 分区值 order by 排序值 DESC/ASC)DESC 表示降序ASC 表示升序特别注意:写sql时,变量名建议用英文具体案例第一步 :先进行子查询,select 店铺名称,商品名称,sum(销量)as 销量 from 销量表 group by 店铺...原创 2020-04-13 18:54:29 · 1378 阅读 · 0 评论 -
推荐算法概览-电商业务
业务场景概述众所周知,电商业务发展至今已经非常成熟,淘宝、京东、拼多多等电商巨头都在上线了覆盖了不同维度的推荐算法,用来提高用户下单率,支付率,延长用户在浏览商品页的时长,准确的商品推荐可以解决用户长时间筛选商品的这个问题,电商中的土场景更是覆盖在交易的各个环节,如果首页,详情页,购物车页,支付成功页或者是错误页等。在电商网站里进行商品推荐,可以提高整个网站商品销售的有效转化率,增加商品销量。...原创 2020-04-11 16:40:38 · 2612 阅读 · 0 评论 -
查找文件中包含某个字符串的行并将所有满足条件行输出到新文件使用命令
查找文件中包含某个字符串的行并将所有满足条件行输出使用命令dos命令 find “关键字” 源文件 > 输出文件例如 find “QD00001” activity.task.log > activity.task1.txtlinux命令 cat 源文件 | grep 关键字 > 输出文件原文:https://blog.csdn.net/sqiucheng/art...转载 2019-03-06 10:32:37 · 8292 阅读 · 0 评论 -
python 安装pyecharts
默认在windows下进行安装,使用win+r打开,输入cmd,进入DOS环境。输入代码:pip install pyecharts ,一般可能会因为墙的原因速度较慢或者是出现断线。所以建议使用清华的镜像来安装:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyecharts复制整条语句使用之前我们要强调一点:就是py...翻译 2019-05-25 14:40:13 · 7940 阅读 · 2 评论 -
数据分析面试经验(给自己一个梳理的过程)
数据分析与数据运营、数据挖掘是数据整个开发生命中的一小章节。数据挖掘的门槛当然比数据分析高,涉及到较多的算法与调优以及如何将某个一个模型运用到实际当中。数据分析则是根据业务的需求,去挖掘数据中存在的有价值的信息,再使用合适的工具(比如excel、tableau、echarts等可视化工具,将数据中蕴含的价值变成表、图、文字等形式)。将近一个月的数据分析面试经验,我感受到了不同公司的氛围。大厂...原创 2019-06-22 21:11:52 · 9853 阅读 · 2 评论 -
pandas的常见的excel与csv导入导出问题汇总
1. 将excel文件导入我的import_excel只有内容,并没有列名,如果直接使用pandas.read_excel(“文件名”),那么excel的第一列会被当做列名进行使用,所以这里我是直接在导入时设置的列名,这样不仅可以正确添加列名,而且简单快捷。2.将csv文件导入3.将文件导出成excel在导出成excel时需要注意,必须要指定导出的名字,以及编码格式,否则可能会乱码,in...原创 2019-07-14 10:51:46 · 1441 阅读 · 0 评论