机器学习-基础学习
机器学习笔记及代码
酸菜鱼摆摆
这个作者很懒,什么都没留下…
展开
-
主题提取模型(LDA)学习记录
MLE vs MAP vs Bayesian从生成的角度来看LDA计算模型参数原创 2021-09-05 22:50:36 · 350 阅读 · 0 评论 -
Xgboost案例学习代码
import osimport pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_scoreimport matplotlib.pyplot as pltimport seaborn as sns#%ma原创 2021-09-03 16:25:16 · 268 阅读 · 0 评论 -
Xgboost原理笔记
原创 2021-09-03 13:51:26 · 70 阅读 · 0 评论 -
矩阵分解-推荐系统案例代码(短视频推荐)
使用矩阵分解,根据用户给短视频的评分数据,做-一个千 人千面的个性化推荐系统需要安装推荐系统库surprise,使用如下命令安装: pip install scikit-surprise#导入numpy和surprise辅助库import numpy as npimport surprise#基于矩阵分解的推荐class MatrixFactorization(surprise.AlgoBase): def __init__(self,learning_rate,n_epochs,n原创 2021-09-01 22:59:24 · 537 阅读 · 1 评论 -
矩阵分解的推荐系统学习笔记
原创 2021-09-01 14:50:31 · 75 阅读 · 0 评论 -
K-means图片处理及降维代码
K-means图片处理from pylab import imread,imshow,figure,show,subplotfrom numpy import reshape,flipudfrom sklearn.cluster import KMeansfrom copy import deepcopy,copyimg = imread('./data/sample2.jpeg')# reshape the picturepixel = reshape(img,(img.shape[0原创 2021-09-01 12:37:02 · 222 阅读 · 0 评论 -
K -means原理底层代码
#导入相应的包 from copy import deepcopyimport numpy as npimport pandas as pdfrom matplotlib import pyplot as plt#导入数据data = pd.read_csv('./data/data.csv')data.head()#提取字段并可视化数据 ,使用scatter plotf1 = data['V1'].valuesf2 = data['V2'].valuesX = np.array(li原创 2021-09-01 12:30:05 · 173 阅读 · 0 评论 -
决策树和随机森林预测员工离职率学习代码
使用决策树和随机森林预测员工离职率我们的任务是帮助人事部门门理解员工为何离职,预测- -个员工离职的可能性.数据来源:#引入工具包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as matplotimport seaborn as sns%matplotlib inline#读取数据df = pd.read_csv("./data/HR_comma_sep.c原创 2021-09-01 12:23:13 · 2602 阅读 · 5 评论 -
k-means学习笔记
重点原创 2021-08-31 11:54:27 · 74 阅读 · 0 评论 -
决策树和随机森林-决策树笔记
本身可以处理非线性问题信息增益=信息熵-条件熵原创 2021-08-28 17:11:35 · 94 阅读 · 0 评论 -
SVM-支持向量机-人脸识别学习代码
线性分类器利用截距式:<w,x>+b原创 2021-08-28 14:16:37 · 386 阅读 · 0 评论 -
SVM(支持向量机)学习笔记
优点:对奇异值不敏感SVM对异常值处理当C定义非常小,参数xi会变大,松弛更大,当c定义非常大,xi参数会变小,增强约束条件核函数总结原创 2021-08-28 14:07:27 · 98 阅读 · 0 评论 -
朴素贝叶斯-简单代码案例实现(垃圾邮箱、文本分类)
适合简单的文本分析(垃圾邮箱分类案例)#读取文件import pandas as pddf = pd.read_csv("data/spam.csv",encoding='latin')df.head()df.drop(columns={'Unnamed: 2','Unnamed: 3','Unnamed: 4'},inplace=True)#重命名数据中的v1,v2df.rename(columns={'v1':'label','v2':'text'},inplace=True)df.原创 2021-08-24 17:01:30 · 926 阅读 · 1 评论 -
朴素贝叶斯_文本表示_笔记
句子的表示boolean vector表示方法count vector 表示方法TF-IDF常用表示方法TF-IDF公式案例详解朴素贝叶斯常见问题1.当特征为实数型的时候,例如使用word2vec数据特征方法,需要使用Gaussian Naive Bayes== 注意 ==Multinomial Naive Bayes 更适合处理整数型数据Gaussian Naive Bayes 更适合处理实数,不适合稀疏数据2.为什么叫"朴素"? --条件独立3.朴素贝叶斯的最大似原创 2021-08-24 16:39:47 · 73 阅读 · 0 评论