憨宝宝
码龄7年
关注
提问 私信
  • 博客:47,841
    47,841
    总访问量
  • 31
    原创
  • 2,227,064
    排名
  • 87
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2017-11-28
博客简介:

憨宝宝的博客

查看详细资料
个人成就
  • 获得53次点赞
  • 内容获得30次评论
  • 获得136次收藏
  • 代码片获得287次分享
创作历程
  • 2篇
    2020年
  • 18篇
    2019年
  • 11篇
    2018年
成就勋章
TA的专栏
  • 机器学习模型
    6篇
  • 机器学习实战
    15篇
  • 书籍
    15篇
  • 个人总结
    20篇
  • 笔记
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

如何处理调用位于anaconda中的python解释器时出现warning问题

在命令行输入python出现“Warning:This Python interpreter is in a conda environment, but the environment has not been activated. Libraries may fail to load. To activate this environment please see https://conda....
原创
发布博客 2020.03.17 ·
1555 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

广义线性模型----logit函数----logistic模型

通过广义模型三条假设构建出的模型都称之为广义线性模型。二分类服从伯努利分布,通过伯努利分布代入广义线性三条假设中,继而推出logit函数的表达形式,建立logistic模型(也称为对数几率模型)。参考文档:https://blog.csdn.net/shevchenkoniit/article/details/79593837https://blog.csdn.net/pi9...
原创
发布博客 2020.02.03 ·
1937 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

关于jupyter notebook无法自动跳转chrome浏览器的处理方法

本文参考:https://www.jianshu.com/p/c6e3a440b5e2这个步骤,u如果不行就改为r。
原创
发布博客 2019.12.13 ·
1172 阅读 ·
2 点赞 ·
1 评论 ·
0 收藏

徒手写代码之《机器学习实战》----K均值算法(1)(对地理坐标进行聚类)

对地理坐标进行聚类说明:将 places.txt 和 Portland.png 放在当前目录下。from numpy import *K-均值聚类支持函数"""1.选择聚类的个数,k。例如k=32.生成k个聚类中心点3.计算所有样本点到聚类中心点的距离,根据远近聚类。4.更新质心,迭代聚类。5.重复第4步骤直到满足收敛要求。(通常就是确定的质心点不再改变)创建 k 个...
原创
发布博客 2019.07.22 ·
1071 阅读 ·
4 点赞 ·
0 评论 ·
5 收藏

徒手写代码之《机器学习实战》----PCA算法(1)(利用PCA对半导体制造数据降维)

利用 PCA 对半导体制造数据降维说明:将 secom.data 放在当前目录下。from numpy import *import numpy as npPCA 算法def pca(dataMat, topNfeat=9999999): #计算均值 meanVals = dataMat.mean(0) #去均值化,均值变为0 meanRemoved ...
原创
发布博客 2019.07.11 ·
1739 阅读 ·
2 点赞 ·
1 评论 ·
18 收藏

徒手写代码之《机器学习实战》-----线性回归算法(1)(预测鲍鱼的年龄)

实战这本书籍里线性回归算法讲了标准线性回归、局部加权线性回归、岭回归、LASSO回归、逐步前向回归。这几个回归的理论部分正在逐步梳理中,尽量本周内完成。预测鲍鱼年龄说明:将 abalone.txt 放在当前目录下。from numpy import *标准线性回归数据导入函数:def loadDataSet(fileName): #general function to...
原创
发布博客 2019.07.10 ·
1331 阅读 ·
4 点赞 ·
1 评论 ·
4 收藏

徒手写代码之《机器学习实战》-----树回归算法(1)(普通回归树与模型回归树的比较)

个人觉得线性回归和树回归问题,都比想象中要复杂,值得探索。树回归的理论部分不难,不过徒手写树回归算法倒是需要琢磨。另: 线性回归和树回归的理论部分在整理中普通回归树与模型回归树的比较说明:将 bikeSpeedVsIq_train.txt 和 bikeSpeedVsIq_test.txt 放在当前目录下。from numpy import *import matplotlib.pypl...
原创
发布博客 2019.07.10 ·
463 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

徒手写代码之《机器学习实战》---adaboost算法(2) (在一个较难数据集上应用AdaBoost)

在一个难数据集上应用 AdaBoost此较难数据即逻辑回归算法中从疝气病症预测病马的数据说明:将 horseColicTraining2.txt 和 horseColicTest2.txt 放在当前目录下。from numpy import *单层决策树生成的函数""" 单层决策树分类函数 Parameters: dataMatrix - 数据矩阵 ...
原创
发布博客 2019.06.21 ·
1105 阅读 ·
1 点赞 ·
1 评论 ·
5 收藏

徒手写代码之《机器学习实战》-----决策树算法(2)(使用决策树预测隐形眼镜类型)

使用决策树预测隐形眼镜类型说明:将数据集文件 ‘lenses.txt’ 放在当前文件夹from math import logimport operator熵的定义"""这部分是在用代码计算香农熵公式,即用代码写公式并计算结果"""def calcShannonEnt(dataSet): #数据集行数 numEntries = len(dataSet) ...
原创
发布博客 2019.05.27 ·
505 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

徒手写代码之《机器学习实战》----KNN算法(3)(手写识别系统项目)

手写识别系统说明:将数据集文件 ‘digits.zip’ 解压至当前文件夹定义将图像转换为向量函数# 导入程序所需要的模块import numpy as npimport operatorfrom os import listdir# 将32*32的二进制图像矩阵转换为1*1024向量def img2vector(filename): # 存储图片像素的向量维度是1x1...
原创
发布博客 2019.05.27 ·
326 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

徒手写代码之《机器学习实战》----KNN算法(2)(约会网站配对项目)

使用 k 近邻算法改进网站的配对效果说明:将数据集文件 ‘datingTestSet2.txt’ 放在当前文件夹# 导入程序所需要的模块import numpy as npimport operator定义数据集导入函数file2matrix函数实现的功能是读取文件数据,函数返回的returnMat和classLabelVector分别是数据集的特征矩阵和输出标签向量。de...
原创
发布博客 2019.05.27 ·
240 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

徒手写代码之《机器学习实战》----逻辑回归算法(1)(从疝气病症预测病马的死亡率项目)

从疝气病症预测病马的死亡率说明:将 horseColicTraining.txt 和 horseColicTest.txt 放在当前目录下。import numpy as npimport matplotlib.pyplot as plt定义 Sigmoid 函数def sigmoid(inX): return 1.0 / (1 + np.exp(-inX))定义一般的梯...
原创
发布博客 2019.05.26 ·
741 阅读 ·
1 点赞 ·
1 评论 ·
9 收藏

徒手写代码之《机器学习实战》---朴素贝叶斯算法(2)(代码更正)

之前的一篇手撕《机器学习实战》4—朴素贝叶斯算法,书中在计算先验概率和类条件概率时,把伯努利模型和多项式模型混用了,先验概率用伯努利模型而类条件概率用的既不是伯努利也不是多项式(有点像多项式模型)。在此,我把所有计算过程统一为运用伯努利模型。代码更正部分主要在以下两个函数中:def trainNB、def classifyNB使用朴素贝叶斯过滤垃圾邮件说明:将 email 文件夹放在当前目...
原创
发布博客 2019.05.20 ·
388 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

构建xgboost和lightgbm模型(某金融数据集)

导入各种包import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import roc_auc_score,f1_scorefrom xgboost import XGBClassifierfrom lightgbm imp...
原创
发布博客 2019.04.10 ·
3061 阅读 ·
3 点赞 ·
2 评论 ·
9 收藏

徒手写理论之-----关于梯度下降算法

个人笔记分享出来,梯度下降算法的总结。欢迎关注博客以及讨论。
原创
发布博客 2019.02.16 ·
228 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

徒手写理论之-----关于极大似然估计

若转载请附上本文博客地址,以下皆为原创。欢迎关注,欢迎粉,欢迎互相交流(可留言留下联系方式),欢迎提专业意见和指正错误,欢迎评论。谢谢您!...
原创
发布博客 2019.02.06 ·
133 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

徒手写理论之-----关于逻辑回归算法(公式推导)

写在草稿纸上的,字比较随性~~~参考文档:《西瓜书》吴恩达《机器学习》
原创
发布博客 2019.01.21 ·
315 阅读 ·
2 点赞 ·
3 评论 ·
0 收藏

徒手写理论之-----关于朴素贝叶斯算法

本来是写在word里的,直接截图贴上来了。笔记均为个人理解,以后会陆续写其它算法的理论,可能尝试手写或者继续用word或者用博客的latex代码。看情况和时间而定。以上所有笔记均为本人原创总结,如有转载请附上原文链接。欢迎持续关注本博客。...
原创
发布博客 2019.01.21 ·
2435 阅读 ·
8 点赞 ·
2 评论 ·
15 收藏

徒手写代码之《机器学习实战》---adaboost算法(1)

adaboost理论部分(公式)后期补充1.创建数据集"""此处不构建太复杂的数据集,不然可能后面用单层决策树时候,效果不好。因为用任何一个单层决策树都无法完全分开这五个数据"""import numpy as npdef loadSimpData(): datMat = np.matrix([[1,2.1],[2,1.1],[1.3,1],[1,1],[2,1]]) ...
原创
发布博客 2019.01.21 ·
551 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

徒手写代码之《机器学习实战》---朴素贝叶斯算法(1)

很久没写博客了,最近 忙着中期考核。补写一下朴素贝叶斯的代码部分,重点和难点在于计算条件概率。计算条件概率和类概率时,代码部分都使用了拉普拉斯平滑,主要是为了避免其它属性携带的信息被训练集中未出现的属性值“抹去”的现象。并且使用了对数的表示法代替直接计算若干个条件概率的乘积值,是因为如果连续的概率乘积会造成数值过小,python可能无法显示出来这样的数值。也叫做防止数值溢出。之所以对数表示法可行...
原创
发布博客 2019.01.15 ·
394 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏
加载更多