![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Machine-Learning
文章平均质量分 59
Alexander plus
Work until you don't have to introduce yourself.....
展开
-
9、【EM算法】之GMM应用
在已知隐变量个数的情况下,gmm的聚类效果会比K-means要好得多原创 2022-07-03 10:13:16 · 174 阅读 · 0 评论 -
【聚类】之浅谈(对比K-means跟DB-scan)
【聚类】之浅谈(对比K-means跟DB-scan)原创 2022-06-24 08:14:04 · 211 阅读 · 0 评论 -
8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)
8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)原创 2022-06-19 17:04:39 · 428 阅读 · 0 评论 -
2、【数据特征预处理】(接上一章特征抽取即转文本数据为数值数据后,特征的标准化、缺失值处理以及特征值选择)
机器学习预处理详细流程,理论+demo原创 2022-06-12 11:35:08 · 140 阅读 · 0 评论 -
1、【特征抽取(NLP)】机器学习之特征工程和文本特征的提取
1、机器学习之特征工程和文本特征的提取原创 2022-06-10 17:10:23 · 263 阅读 · 0 评论 -
7、【贝叶斯算法】之实现一个简单的拼写纠正补全器
* P(c), 文章中出现一个正确拼写词 c 的概率, 也就是说, 在英语文章中, c 出现的概率有多大* P(w|c), 在用户想键入 c 的情况下敲成 w 的概率. 因为这个是代表用户会以多大的概率把 c 敲错成 w* argmaxc, 用来枚举所有可能的 c 并且选取概率最大的...原创 2022-06-19 09:20:39 · 154 阅读 · 0 评论 -
6、【集成学习】之bagging、boosting、stacking浅析
6、【集成学习】之bagging、boosting、stacking浅析原创 2022-06-19 07:32:10 · 150 阅读 · 0 评论 -
5、【Grid_Search-K折合交叉验证】使用网格搜索进行k折合交叉验证寻找最佳算法参数组合
上次案例中,通过手动写K折合交叉验证找出了最佳参数,然而在最终预测结果上并不理想,故此处使用sklearn自带的Grid_Search库进行搜索。原创 2022-06-18 09:03:19 · 260 阅读 · 0 评论 -
4、【逻辑回归】信用卡欺诈检测(下采样、SMOTE,调整sigmod函数阈值)
对于一个二分类问题,首先想到的还是逻辑回归!(我愿称逻辑回归为最nb的二分类算法,目前为止)原创 2022-06-16 19:23:11 · 879 阅读 · 0 评论 -
3、【正式建模】之数据划分、模型选择以及模型评估、调优
【正式建模】之数据划分、模型选择以及模型评估、调优原创 2022-06-15 08:58:07 · 139 阅读 · 0 评论 -
利用鸢尾花数据集复现DBSCAN密度聚类算法
利用鸢尾花数据集复现DBSCAN密度聚类算法原创 2022-04-08 14:58:33 · 4682 阅读 · 1 评论 -
利用鸢尾花数据集对比贝叶斯分类器跟决策树的分类情况 (非二元分类 三分类问题)
对于这样一个简单的三分类问题,我打算直接采用2.5:7.5的划分并用贝叶斯跟决策树分别训练对比分类效果,详细步骤如下:原创 2022-03-21 11:04:02 · 2809 阅读 · 0 评论 -
机器学习_01(特征工程提取)
- 字典类型处理:- 文本类型处理 : - 1 单个字符不进行统计,每篇文章中出现一次便记作一次,特征值不再重复出现,但是出现次数可以进行计算累加 - 2 对应特征值在原来文章中不出现则计为0 - 3 对于中文字符,同样,单个字符无意义,长句子可以先分词然后用逗号隔开原创 2020-11-20 17:20:58 · 237 阅读 · 0 评论