数据分析
jeeeee_no
这个作者很懒,什么都没留下…
展开
-
SQL常见计算方法总结
1. 两列合并concat(dt, member_id) dtpid2. 复杂的筛选可以用with … as …with cond1 as (selet ... from ... where ...),cod2 as(select ... from ... where ...)select ... from ... where ...在最后一个select… from… 中可进行条件筛选where concat(dt, pid) in (select dtpid from cond原创 2021-09-11 23:16:10 · 4348 阅读 · 0 评论 -
Python机器学习 - 卡方检验, LabelEncoder, One-hot, xgboost, shap
一、统计学相关1. crosstable# 计数ct = pd.crosstab(label, feature, margins=True)# 比例ct_prob = contingency_table.div(ct['All'], axis=0)2. 卡方检验# p-valuescipy.stats.chi2_contingency(cross_table)[1]# chi^2scipy.stats.chi2_contingency(cross_table)[0]3. Selec原创 2021-09-11 22:56:23 · 343 阅读 · 0 评论 -
Python Pandas基础数据处理方法总结
目录一、提取数据1. 从csv文件2. 从数据仓库二、新建1. DataFrame三、数据筛选1. 判断空值2. 根据一列数据筛选四、表之间1. 横向合并(列相同情况下)2. 纵向合并3. merge五、表内1. 排序2. 去重3. 分组计数4. groupby( )5. iloc( )6. 循环每列7. 删除/选取列五、统计学相关1. crosstable2. 卡方检验3. SelectKBest五、Jupyter Notebook相关1. 展示所有行/所有列一、提取数据1. 从csv文件pd.re原创 2021-09-11 22:25:57 · 140 阅读 · 0 评论 -
Python实现t-test(T检验)
在python中进行t-test很简单,只需要scipy包,不需要任何手动计算。代码如下(为了节省空间数据只取全部数据表的前五个):from scipy import statsimport numpy as npimport scipy.statsrequest_c = np.array([30, 152, 267, 369, 478])request_e = np.array([30, 152, 277, 383, 497])t, pval = scipy.stats.ttest_in原创 2021-07-30 23:46:42 · 10559 阅读 · 1 评论 -
SQL筛选日期为周末 - datename( )
对于SQL表里日期列筛选,只保留周末的数据可以用SQL中的datename()函数。例:select id, Name, Datefrom table_awhere datename(weekday, Date) in ('Saturday', 'Sunday');同理可以用只工作日/只周一等其他筛选条件。...原创 2021-07-30 23:33:07 · 1670 阅读 · 0 评论 -
SQL GROUP BY 1
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2021-07-30 14:43:03 · 972 阅读 · 0 评论 -
滴滴/快手/头条数据分析实习岗SQL测试题总结
最近找实习基本上每个岗位都有SQL考试内容,有的岗位(滴滴国际化)是笔试题,有的岗位(抖音数据BP和快手)是面试现场做题。主要考察点包括group by,case when,order by ... limit ...这些。下面列几道题的解法:第一题(滴滴笔试)学生表(tb_student)学生姓名 (name)学号 (id)班级 (class)入学时间 (in_time)年龄 (age)性别 (sex)专业 (major)张三2017C33010012017C330原创 2021-07-28 00:01:07 · 3573 阅读 · 1 评论