Alexander plus
Work until you don't have to introduce yourself.....
展开
-
9、【EM算法】之GMM应用
在已知隐变量个数的情况下,gmm的聚类效果会比K-means要好得多原创 2022-07-03 10:13:16 · 174 阅读 · 0 评论 -
【聚类】之浅谈(对比K-means跟DB-scan)
【聚类】之浅谈(对比K-means跟DB-scan)原创 2022-06-24 08:14:04 · 211 阅读 · 0 评论 -
8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)
8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)原创 2022-06-19 17:04:39 · 428 阅读 · 0 评论 -
7、【贝叶斯算法】之实现一个简单的拼写纠正补全器
* P(c), 文章中出现一个正确拼写词 c 的概率, 也就是说, 在英语文章中, c 出现的概率有多大* P(w|c), 在用户想键入 c 的情况下敲成 w 的概率. 因为这个是代表用户会以多大的概率把 c 敲错成 w* argmaxc, 用来枚举所有可能的 c 并且选取概率最大的...原创 2022-06-19 09:20:39 · 154 阅读 · 0 评论 -
6、【集成学习】之bagging、boosting、stacking浅析
6、【集成学习】之bagging、boosting、stacking浅析原创 2022-06-19 07:32:10 · 150 阅读 · 0 评论 -
5、【Grid_Search-K折合交叉验证】使用网格搜索进行k折合交叉验证寻找最佳算法参数组合
上次案例中,通过手动写K折合交叉验证找出了最佳参数,然而在最终预测结果上并不理想,故此处使用sklearn自带的Grid_Search库进行搜索。原创 2022-06-18 09:03:19 · 260 阅读 · 0 评论 -
4、【逻辑回归】信用卡欺诈检测(下采样、SMOTE,调整sigmod函数阈值)
对于一个二分类问题,首先想到的还是逻辑回归!(我愿称逻辑回归为最nb的二分类算法,目前为止)原创 2022-06-16 19:23:11 · 879 阅读 · 0 评论 -
3、【正式建模】之数据划分、模型选择以及模型评估、调优
【正式建模】之数据划分、模型选择以及模型评估、调优原创 2022-06-15 08:58:07 · 139 阅读 · 0 评论 -
2、【数据特征预处理】(接上一章特征抽取即转文本数据为数值数据后,特征的标准化、缺失值处理以及特征值选择)
机器学习预处理详细流程,理论+demo原创 2022-06-12 11:35:08 · 140 阅读 · 0 评论 -
1、【特征抽取(NLP)】机器学习之特征工程和文本特征的提取
1、机器学习之特征工程和文本特征的提取原创 2022-06-10 17:10:23 · 263 阅读 · 0 评论 -
SQL小心得
满满干货,无废话,会一直坚持更新原创 2022-06-09 09:36:10 · 128 阅读 · 0 评论 -
Pyecharts帮助文档
pyecharts:https://pyecharts.org/#/zh-cn/intro原创 2021-05-24 15:33:01 · 369 阅读 · 0 评论 -
超市订单数据分析
import pandas as pd import matplotlib.pyplot as pltimport numpy as npdata = pd.read_excel('./data.xlsx')data.describe()data.info()data.head()data.省份 = np.where(data.省份 == 'Jiangsu','江苏',data.省份)data1 = data.groupby('省份').sum()[['销售额','利润额']]data1原创 2021-05-10 09:25:40 · 410 阅读 · 0 评论 -
抓取前程无忧51job海量信息进行数据分析并进行可视化
成果展示大数据人才需求分布图大数据相关学历要求大数据相关企业招人数目大数据相关企业规模大数据相关企业类型大数据相关经验需求漏斗图大数据相关职位经验与平均薪资关系大数据相关职位学历与平均薪资关系大数据相关所属行业类别懒癌犯了,爬虫代码参考另一篇博客,10万条数据一个半小时完成抓取(完整预处理及画图代码,后面有时间会考虑补更)...原创 2021-01-23 10:44:58 · 1015 阅读 · 0 评论 -
jupyter notebook安装插件
jupyter notebook安装插件原创 2020-12-24 20:13:27 · 112 阅读 · 1 评论 -
机器学习的大门开了.......
初识机器学习:研究沿海城市距离跟其温度湿度之间的关系案例原创 2020-10-31 11:40:03 · 366 阅读 · 2 评论 -
数据分析三剑客:Numpy、Pandas、Matplotlib(你想看的这里都有,超详细版本)
写在前面的话:一直以来,笔者都非常想尝试将所学的知识体系化从而搭建出一名数据分析师应该具备的知识框架与数据处理能力,三剑客将是这条路的起点,本文为笔者原创,耗费近一周左右的私人时间,原创不易,希望读者盆友们多多指正,时间有限,文中出现的错误也希望大家指正,最后,本文的源码跟数据集笔者已放至微信公众:天玄小屋,有需要的盆友可自便。原创 2020-10-30 21:15:56 · 815 阅读 · 0 评论