自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 AB test 分析经验

最近做了一个AB,有几点经验值得记录一下。背景用户每日都可以打卡到微信,引导关注公众号。近期关注率有下降,怀疑与微信屏蔽有关,(微信抵制诱导分享引流到公众号)。因此申请一个新公众号做测试,新老两个公众号内容均一致,观测两个公众号的关注率是否有差异。关注指标:关注用户数/打卡用户数过程AB实验 1号上线,上线时全量切origin,2号开始1:1切分析step1观察当天新进入分组的用...

2019-11-13 13:19:42 1196

原创 conda 更新python包速度太慢切换至国内清华镜像

长时间不用python,导致python很多包版本过低,在执行时报错。可用以下语句一键更新conda upgrade --all但是因为anaconda从官网上下载慢,导致报以下错误CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.continuum.io/pkgs/main/win-64/repoda...

2019-07-21 22:45:59 8270

原创 Linux命令_文件查找

目录下的所有文件中查找字符串,并且只打印出含有该字符串的文件名方法一:find .| xargs grep -ri "dim_lls_user_professions" -l上面的命令有个问题,会使满足条件的文件名,列出2次方法二:grep "dim_sprout_user_profile" ./ -Rn -l 那要列出文件内容包含2个字符串的文件的文件名?...

2019-06-11 11:32:29 205

原创 mac上Matplotlib中文乱码问题

本地 python3版本 用matplotlib或seaborn作图时,出现以下告警,表明是中文显示的问题。/anaconda3/lib/python3.6/site-packages/matplotlib/font_manager.py:1328: UserWarning: findfont: Font family ['sans-serif'] not found. Falling ba...

2018-08-08 22:43:18 9795 13

原创 Charles 抓包工具

Charles 抓包工具。 对于数据分析来说,常常用到打点(埋点)数据,有时需要自己验证打点是否有误。 简单来说,就是将手机和电脑设置在同一网络下,对手机app进行操作,charles可以捕捉这一系列行为。1.下载及注册下载并注册,或者直接下载破解版。 我这里官网下载最新版 v4.2.6版本。下载打开,help-register,填入下方注册码,完成注册。 // Charle...

2018-07-11 15:04:31 5889 1

原创 Mac在coursera上视频无法播放,长期黑屏

Finder 前往-&gt;前往文件夹 ,在弹出的对话框里面 输入 /private/etc/,然后找到hosts文件复制该文件到桌面(不能直接修改),在桌面上用文本编辑打开hosts文件在文件最底行添加:52.84.246.72 d3c33hcgiwev3.cloudfront.net保存,将修改过的hosts文件拖回原处,替换原来的hosts再次打开coursera上的视频,成功播放...

2018-07-04 22:19:16 3419 3

原创 Pandas 分组占比

分组占比 背景: 求每个用户做题的通过率:先算出用户总的做题数量,再算出用户通过的做题数量。 pandas的groupby用法## 总的数量count_df = df.groupby('user_id')["if_pass"].count()test_df = pd.DataFrame(count_df)test_df = test_df.reset_index()...

2018-07-04 08:06:36 24965

原创 zsh: command not found: conda

https://blog.csdn.net/codechelle/article/details/77414117 上次安装了zsh后,终端输入cond命令报错: zsh: command not found: conda 先尝试在 ~/.bash_profile里加入了路径,没有用(事实上,安装Anaconda时,已经自动加上了)看了stackoverflow上的提问,才知道原来还有z...

2018-06-22 15:48:47 1375

原创 AB test

前言AB test 在实际工作中,A/B test是产品改动时常用到的手段。 为同一目标,制定两种方案,在相同时间维度下,随机分组,让用户使用两种不同的方案,并收集两组人群的用户行为数据和业务数据。 比如,通过设计两种文案/操作方式/界面风格等,通常其中一套方案是老版本,另一套方案是新版本。 在新版本上线前,先对少部分人进行AB test,根据显著性检验,检验方案是否的确可以带来特...

2018-04-27 23:01:51 3657

原创 零基础开启Git使用

第一次上手git,分布式版本控制系统。本文将结合公司使用的gitlab,总结零基础入门的学习过程,作为自己解答疑惑的记录。 主要参考: 1. 大致的过程:https://linux.cn/article-4292-1-rss.html 2. 廖雪峰:地址 3. Gitbook: 地址(主要看前三章)git push -u origin master将本地的master传到...

2018-04-02 17:33:31 754

原创 SQL语法——left join on 多条件

left join on +多条件与where区别重点先匹配,再筛选where条件。本文将通过几个例子说明两者的差别。表1:product id amount 1 100 2 200 3 300 4 400表2:product_details id weight exist...

2018-03-30 22:22:30 355295 15

转载 python 调用自己的包或模块

转载 1、http://blog.csdn.net/u010412719/article/details/47089883 这个是简单调用,一般自己用这个即可。 2、http://blog.csdn.net/luo123n/article/details/49849649 这个是将自己写的模块做成包...

2018-02-27 12:00:13 20148 1

原创 python 连接impala报错(windows系统)

错误ThriftParserError: ThriftPy does not support generating module with path in protocol 'd' 看anaconda安装在哪个盘,就会报错‘d’或者‘e’。原因:路径不对。 定位到 D:\Anaconda3\Lib\site-packages\thriftpy\parser\parser.py 的,第487行修改

2017-12-14 11:57:43 1846

原创 tensorboard运行报错

tensorboard 报错

2017-08-17 12:25:58 1081

原创 sublime 执行python,并在python2和3之间切换。

mac版,sublime 执行 python 2和3

2017-07-20 15:59:17 4066 1

原创 machine learning yearning 吴恩达——笔记

前言:吴恩达的新书,目前只看到前14章,做个学习笔记。 深度学习(神经网络)已经出现多年,为何有些概念最近才火,有两个条件:可获取数据,大数据的到来,使数据量足够作为训练数据计算能力变强对于传统算法,比如logistic回归,数据量变大并不会大幅度提高性能,而在较少的隐藏层的神经网络上就可以有较高提升。 目前,提高算法性能的方法: 1)训练更多的网络,train a bigger net

2017-06-13 15:41:55 1866

原创 阿里云ECS、datahub、RDS、ADS、OTS、MaxCompute及BI报表展示串联

上周部门做了一个培训,利用阿里云产品实现了数据从采集,到存储,开发及报表展示的全过程,实现了流计算和实时计算两个过程。在此做个学习记录。 涉及产品ECS云服务器、DataHub、ADS、OTS、RDS,quickBI。 1.流计算源数据:由python脚本和shell脚本模拟产生。 user表(用户信息表):用户id、星座,性别,年龄,省份等。 goods sale表:用户id、商品类别、商

2017-06-12 11:08:46 12982 1

原创 已安装python3,安装pip3 ,再安装tensorflow(for mac)

安装pip3,及CPU版本的tensorflow

2017-06-06 21:32:13 14143 3

原创 安装pyodps -mac版

安装步骤首先确保pip安装,pip安装可以参考 地址 。接着确保setuptools和requests的版本,对于非windows(windows也可以,但要确保编译器配置正确)可以安装cython加速tunnel上传下载。pip install setuptools>=3.0pip install requests>=2.4.0pip install cython>=0.19.0 # 可选接

2017-05-19 14:46:56 1068

原创 Mac下安装python以及jupyter notebook

Mac下安装python以及jupyter notebookpython安装(anaconda)

2017-05-18 19:19:24 3263

原创 如何修改jupyter notebook的默认工作路径

找到python安装路径下的Script文件,找到jupyter-notebook.exe,发送快捷方式到桌面。(我这里安装的是anaconda) 在桌面的jupyter-notebook快捷方式中,右键属性,修改起始位置。 下次打开时,直接双击桌面的快捷方式即可。

2017-04-03 16:50:57 4177

原创 R语言和Python中sort(),rank()和order()的各自区别(默认都是升序)

举例说明: x<-c(97,93,85,74,32,100,99,67) sort(x) [1] 32 67 74 85 93 97 99 100 rank(x) [1] 6 5 4 3 1 8 7 2 order(x) [1] 5 8 4 3 2 1 7 6sort:按从小到大排序; rank:该数对应于向量的第几名(按从小到大)。比如97

2017-03-07 17:02:13 15160 2

原创 基于宠物用品电商搜索条目的聚类分析

基于宠物用品电商搜索条目的聚类分析目标针对667条宠物商品的搜索关键字进行聚类,将相似度高的条目聚为一类。在用户搜索某一商品时,电商平台能据此为用户展示类似的商品,从而提高用户的购物体验。思路首先明确这是一个聚类问题,而不是分类。因为商品类目本身是没有标签的,用机器学习的话来说,这是一个无监督学习的问题。接着,分析大致做法: 1. 数据导入 2. 处理数据(转化为语料库,再进行清洗过程) 3.

2016-12-16 10:15:48 1467

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除