数据分析
文章平均质量分 92
White Root
也许回顾这一生,只是情感积累。无所谓做什么,只需告诉自己在路上。
展开
-
数据分析和数据挖掘
数据分析-聚类分析聚类分析分析方法技术问题年龄收入分群案例聚类分析总结回归分析聚类分析分析方法技术问题均值的问题 kmeans 更新中心点 均值点异常数据会影响均值 要去异常量纲的问题 —要做标准化 — 基于距离的数据量大的问题m个样本,n个特征,k个中心点,t次迭代 算法复杂度 O(tkm*n)mini-batch-kmeans来解决数据量大的问题结论:MiniBatchKMeans在基本保持了K-Means原有较高类别识别率的前提下,其计算效率的提升非常明显原创 2020-07-22 11:30:36 · 596 阅读 · 0 评论 -
数据分析-sql基本操作
SQL数据分析介绍sql常见操作回顾聚合函数使用分组子查询多表联结查询组合查询CASE表达式利用SQL对淘宝用户行为进行数据分析数据导入与清洗用户行为分析数据总体情况用户行为转化情况分析用户行为习惯分析用户类目偏好分析介绍sql常见操作回顾聚合函数使用1.计算价格的平均值select avg(Price) as avg_price from house_price2.计算数据的总量select count(*) from house_price #计算的是所有数据,包含空的行selec原创 2020-07-22 10:14:05 · 600 阅读 · 0 评论 -
数据分析-sql高级
SQL高级操作Sql高级操作取出数据并显示行号Sql高级操作取出数据并显示行号select p_name,p_type,p_view from products ORDER BY p_view desc原创 2020-07-22 10:10:37 · 408 阅读 · 0 评论 -
数据分析-pandas数据处理
数据分析-pandas数据处理概述业务建模流程特征工程数据清洗缺失值处理异常值(极值)处理重复值处理python数据清洗案例数值型数据的处理标准化&&归一化pca降维离散化/分箱/分桶----将数据简化分类数据的处理时间类型数据的处理样本类别分布不均衡Python处理样本不均衡案例smote上采样randomundersampler数据抽样概述业务建模流程将业务抽象为分类or回归问题定义标签,得到y选取合适的样本,并匹配出全部的信息作为特征的来源特征工程 + 模型训练 + 模型原创 2020-07-16 11:15:28 · 905 阅读 · 0 评论 -
数据分析-Excel基本操作(简)
Excel基本函数原创 2020-07-13 09:11:46 · 398 阅读 · 0 评论