数据挖掘
文章平均质量分 74
南师大蒜阿熏呀
帅的人已经醒来~~~
∩∩
(´・ω・)
_| ⊃/(___
/ └-(____/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄
展开
-
pandas对于文件数据基本操作,数据处理常用
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple (安装包) 清华安装例如国内的其他镜像源清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/原创 2022-12-23 13:47:05 · 1621 阅读 · 2 评论 -
模型应用系实习生-模型训练笔记(更新至线性回归、Ridge回归、Lasso回归、Elastic Net回归、决策树回归、梯度提升树回归和随机森林回归)
检测函数,输入dataframe用for循环对每列检测和操作, 自动检测空值,object类型数据,并且进行默认操作,df.fillna(method=‘pad’, inplace=True) # 填充前一条数据的值df.fillna(method=‘bfill’, inplace=True) # 填充后一条数据的值独热编码返回处理好的dataframe。原创 2023-11-01 17:16:39 · 1338 阅读 · 0 评论 -
不平衡二分类训练数据处理
先生成不平衡数据集上采样方法,根据最多的数据集将少的数据集进行填充和打乱,数据集少的情况考虑,数据集太大会导致训练成本的提高结果如下。原创 2023-05-23 12:04:25 · 237 阅读 · 0 评论 -
机械学习房价预测实战(mse 回归 交叉验证)
机器学习的框架有哪些?请写出其构建一个机器学习的流水线。原创 2022-09-28 12:48:51 · 1130 阅读 · 5 评论 -
机械学习模型训练常用代码(随机森林、聚类、逻辑回归、svm、线性回归、lasso回归,岭回归)
机械学习模型训练常用代码(特征工程、随机森林、聚类、逻辑回归、svm、线性回归、lasso回归,岭回归)原创 2023-04-14 17:05:37 · 1488 阅读 · 0 评论 -
数据可视化建模 常用
本文直接进入可视化,输入讲解输入列表生成图片,关于pandas操作看这篇。原创 2023-02-11 21:13:12 · 1244 阅读 · 0 评论 -
文本分析合集,文本向量处理的方法jieba,对文本的特征工程之TfidfVectorizer以及结合TruncatedSVD,WordCloud词云图展示
文本分析合集,文本向量处理的方法jieba,对文本的特征工程之TfidfVectorizer以及结合TruncatedSVD,WordCloud词云图展示对于一列文本我们需要对其进行操作的话首先要进行分词处理例如如下列表我们进行最简单的jieba分词处理这是分词后的结果。原创 2023-03-11 17:39:10 · 684 阅读 · 0 评论