不会统计的大河马
码龄5年
关注
提问 私信
  • 博客:72,677
    72,677
    总访问量
  • 33
    原创
  • 1,356,621
    排名
  • 63
    粉丝

个人简介:本科统计学|研究生应用统计 python、SQL、R、SAS 小红书同名学习博主

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2020-04-21
博客简介:

qq_47250064的博客

查看详细资料
个人成就
  • 获得49次点赞
  • 内容获得12次评论
  • 获得629次收藏
  • 代码片获得3,351次分享
创作历程
  • 1篇
    2023年
  • 32篇
    2022年
成就勋章
TA的专栏
  • SAS
    1篇
  • 机器学习
    13篇
  • sklearn
    13篇
  • numpy
    9篇
  • pandas
    10篇
  • matplotlib
    4篇
  • tensorflow
    1篇
  • 深度学习
    1篇
  • 聚类分析
    2篇
兴趣领域 设置
  • Python
    python
  • 大数据
    mysql
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

SAS自学(一)介绍、读数据

SAS简介与数据的读取
原创
发布博客 2023.02.28 ·
883 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

集成学习之Bagging与随机森林(ensemble learning)

集成学习里面的随机森林,用交叉验证来计算随机森林解决决策树的过拟合问题。用随机森林解释普通学习和增量学习的区别,增量学习是新数据训练模型之后,模型仍然记得原来的树。
原创
发布博客 2022.09.25 ·
1456 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

Sklearn机器学习——预测明天是否会下雨

探索澳大利亚天气,进行特征工程时对于地点这个特征进行爬虫爬取,使之与气候站的天气进行关联。数据预处理也比较繁琐。后期进行建模对于准确度和recall都进行不断优化。算是难度比较大的一个svm案例。
原创
发布博客 2022.09.07 ·
5457 阅读 ·
7 点赞 ·
6 评论 ·
91 收藏

Sklearn机器学习——ROC曲线、ROC曲线的绘制和AUC面积、运用ROC曲线找到最佳阈值

介绍了如何平衡分类正确率和误判多数变成小数的成本的一个图像,ROC曲线(横坐标是假正率,纵坐标是Recall)。AUC曲线面积越大越好。
原创
发布博客 2022.09.03 ·
14585 阅读 ·
9 点赞 ·
0 评论 ·
120 收藏

Sklearn机器学习——样本不平衡问题解决、精确率、召回率、ROC曲线

介绍样本分类不平衡问题的解决办法,以及SVC的六个模型评价指标,ROC曲线。
原创
发布博客 2022.09.01 ·
6787 阅读 ·
3 点赞 ·
0 评论 ·
47 收藏

机器学习Sklearn——核函数参数的选取、硬间隔和软间隔、重要参数C

介绍四个核函数的参数如何选取,运用学习曲线和网格搜索进行调参。介绍了硬间隔和软间隔的概念,并在数据不完全线性可分,介绍了松弛变量里面的惩罚系数C。在乳腺癌数据案例中找到rbf最适合的两个参数...
原创
发布博客 2022.08.31 ·
2303 阅读 ·
6 点赞 ·
0 评论 ·
20 收藏

机器学习Sklearn——核函数、核函数在不同数据集上的表现、核函数的优势和缺点

介绍核函数的不同类型、核函数在不同数据集上的表现,在rbf上表现最好。以及核函数的缺点,提醒我们需要将数据进行统一量纲处理。
原创
发布博客 2022.08.29 ·
4465 阅读 ·
3 点赞 ·
1 评论 ·
43 收藏

机器学习Sklearn——SVM支持向量机(基础理论、决策过程可视化)

手撕SVM损失函数的求解,有拉格朗日乘子法、对偶问题、KKT条件,将使用SVM进行决策过程可视化从线性的推广到非线性的3D图中。
原创
发布博客 2022.08.25 ·
3770 阅读 ·
2 点赞 ·
0 评论 ·
37 收藏

机器学习Sklearn——红酒分类案例详解决策树模型参数

比较细节得讲了决策树的六个参数,一个重要参数,两个随机参数和三个剪枝参数,以及决策树如何让将这个图片导出来。
原创
发布博客 2022.08.24 ·
5623 阅读 ·
5 点赞 ·
0 评论 ·
80 收藏

深度学习课程笔记——回归、精灵宝可梦案例

本文介绍深度学习中回归案例,通过计算进化后的精灵宝可梦的武力值进行线性回归,从最简单的一次回归模型不断优化成带有条件函数的二次模型,模型评价详细介绍了MLS的解决办法(梯度下降)和过拟合解决办法(正则化)。
原创
发布博客 2022.08.21 ·
915 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

机器学习基础——模型的加载和保持、逻辑回归

介绍了逻辑回归这个解决二分类模型的判别模型,用癌症分类问题进行了案例分析,温习了估计其流程以及召回率。并最后阐明了模型的优缺点以及与朴素贝叶斯这个生成模型的区别。
原创
发布博客 2022.08.19 ·
1207 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

机器学习基础——线性回归、过拟合和欠拟合、岭回归和Lasso回归

介绍了非监督学习里面的回归算法的定义,并用波士顿房价的例子进行线性回归,将两种解法(梯度下降法和正规方程法)进行对比,运用均方误差和进行模型评估。还介绍了过拟合和欠拟合以及他们的解决办法(岭回归和Lasso回归)。.........
原创
发布博客 2022.08.17 ·
2463 阅读 ·
1 点赞 ·
1 评论 ·
17 收藏

机器学习基础——分类算法之决策树、随机森林、Titanic乘客生存分类

对于决策树和随机森林两个模块进行介绍,用kaggle里面的泰坦尼克号数据集预测生存分类进而巩固算法。随机森林对于相同的数据集进行运算准确率更高,普适性更强。
原创
发布博客 2022.08.16 ·
1676 阅读 ·
2 点赞 ·
0 评论 ·
24 收藏

机器学习基础——分类算法之朴素贝叶斯算法(Bayes)、分类模型评估、选择和调优

介绍了运用贝叶斯算法进行分类,他 的基本概念、进行文本分类案例,进行优缺点的评估。以及分类模型地方调参技巧(网格搜索)以及交叉验证,并在实例中进行检验
原创
发布博客 2022.08.13 ·
3839 阅读 ·
1 点赞 ·
0 评论 ·
30 收藏

机器学习基础——分类算法之K近邻算法(KNN)、预测facebook签到位置案例

机器学习里面的knn算法,比较细节得分析了一个 kaggle上面的完整案例,包括处理数据、拟合模型和测试模型,计算准确率等。
原创
发布博客 2022.08.12 ·
1382 阅读 ·
0 点赞 ·
0 评论 ·
15 收藏

机器学习基础——数据集的划分、转换器和估计器

在sklearn包里面学会一些数据集(鸢尾花、糖尿病、伦敦房价)以及如何split这些数据集为train data和test data ;介绍了处理数据的transformer和算法的接口以及非监督学习的步骤,为后续做回归以及分类打基础......
原创
发布博客 2022.08.11 ·
434 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

研究用户对物品类别的喜好细分降维——PCA(主成分分析)

可以用scikit-learn包来直接调用主成分分析PCA,除了透视表pivot_table()之后,pd.crosstab()透视表。还通过实例介绍了表合并的技巧。
原创
发布博客 2022.08.10 ·
703 阅读 ·
1 点赞 ·
2 评论 ·
2 收藏

DataFrame基础操作巩固——项目需求

用户消费行为分析,增加了透视表、map、applymap和apply函数的区分还有一些数据分析的思路,融合了画散点图、直方图和折线图,增加了匿名函数和def函数
原创
发布博客 2022.08.08 ·
415 阅读 ·
2 点赞 ·
1 评论 ·
4 收藏

Dataframe基础操作巩固——美国大选献金项目

对于美国总统大选的数据进行分析,看看美国几个党派,根据政治献金来判断谁有可能做总统。
原创
发布博客 2022.08.07 ·
256 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

DataFrame基础操作巩固——人口分析案例

对于人口进行案例数据分析,运用pandas将dataframe里面的人口数据进行处理分析
原创
发布博客 2022.08.03 ·
579 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏
加载更多