![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Royel transformed
进击的程序猿
展开
-
module tensorflow has no attribute placeholder
解决办法,亲测有效环境中的tf是2.0版本的,但是我们使用了很多1.0版本的api,tensorflow从1更新到2的版本,我们涉及的import tensorFlow 操作太多,所以建议降到1的版本。原创 2020-06-08 11:26:34 · 1734 阅读 · 0 评论 -
【面经分享】阿里一面算法题分享
https://juejin.im/post/5e86c5986fb9a03c3176149c原创 2020-04-03 13:23:15 · 370 阅读 · 0 评论 -
模型融合
好文章:https://zhuanlan.zhihu.com/p/61705517原创 2020-03-07 15:20:49 · 353 阅读 · 0 评论 -
解决loss变成nan
1.当损失函数中出现log(0)*0的情况,就会出现nan:log(0)=-inf本身没有问题,可以安全参与多数计算,但是当-inf*0就会出现问题,所以为了避免这种情况,变为y_true*log(y_pred+1e-10)一般y_pred是经过sigmoid函数处理的结果。或者可以将y_pred 限制在合理范围内,如下:eps = 1e-9y_pred = torch...原创 2019-11-04 22:51:12 · 1092 阅读 · 0 评论 -
matplotlib一图画两线
import matplotlib.pyplot as pltval_f1_list=[1,2,3]train_f1_list=[2,3,4]plt.figure(figsize=[20,9])plt.plot(val_f1_list,label="val_f1",color="#F08080")plt.plot(train_f1_list,label="train_f1",color...原创 2019-11-01 10:30:20 · 2879 阅读 · 0 评论 -
利用热力图绘制混淆矩阵
利用热力图绘制混淆矩阵,并且通过cmap这一参数将热力图设置为值越大颜色越深,可以帮助我们清晰地看到各个类别的预测效果,一眼即可看出哪个类别预测的好坏。cmap中有些颜色是值越大越深的,可以自行选择,哪些颜色是越大越深参考这篇文章from sklearn.metrics import confusion_matriximport seaborn as snlabel=[1,0,1,0...原创 2019-10-30 12:09:00 · 8139 阅读 · 0 评论 -
【机器学习基础】GBDT完全解读-有例子
完全解读-传送门原创 2019-05-15 18:37:07 · 218 阅读 · 0 评论 -
【机器学习基础】朴素贝叶斯分类器完全解读
完全解读-传送门原创 2019-05-15 18:36:03 · 153 阅读 · 0 评论 -
每日一道算法题--leetcode 21--合并两个有序链表--python
详解在本人掘金博文中,不想写两遍,直接上链接了。点此传送门原创 2019-04-09 17:35:13 · 120 阅读 · 0 评论 -
leetcode 腾讯精选50题
https://leetcode-cn.com/problemset/50/ 腾讯精选50题2019-04-03开始原创 2019-04-03 10:28:15 · 542 阅读 · 0 评论 -
每日一道算法题--leetcode 144--二叉树前序遍历--python
文章在本人掘金文章中,下面是传送门:包含两种解法,一种是递归的,一种是迭代的:二叉树前序遍历传送门原创 2019-04-03 10:08:39 · 159 阅读 · 0 评论 -
【机器学习基础】CART--分类回归树完全解读
完全解读-传送门原创 2019-05-15 18:37:49 · 309 阅读 · 0 评论 -
用plt.pcolormesh绘制分类图及分类边界
import matplotlib.pyplot as pltimport numpy as npfrom sklearn import svmfrom sklearn.model_selection import train_test_split#训练svm分类器x= np.array([[-1,-1],[-2,-1],[1,1],[2,1],[-1,1],[-1,2],[1,-1]...原创 2019-05-21 11:28:49 · 2965 阅读 · 1 评论 -
sklearn中SVC中的参数说明与常用函数
svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_iter=-1, decision_function_shape=...原创 2019-05-22 10:39:35 · 31663 阅读 · 2 评论 -
GBDT调参指南
传送门原创 2019-05-27 23:37:03 · 2785 阅读 · 0 评论 -
关于K-FOLD
from sklearn.model_selection import KFoldt=[5,7,8,9,63,412,36,951,23,8]kf=KFold(n_splits=5,shuffle=True)generat=kf.split(t)#此处的generat变量是一个迭代器########下面利用内置函数next,取出其中的分组结果,由于n_splits=5,只能得到5次,在第...原创 2019-07-19 16:26:39 · 258 阅读 · 0 评论 -
【神经网络基础】BP算法原理及两种实现
BP算法原理及实现原创 2019-09-18 16:34:16 · 483 阅读 · 0 评论 -
jupyter notebook 误删恢复
误删了代码段,不要关闭,立刻输入history,并运行,就会出现你的历史代码,再粘出来就好。原创 2018-12-11 17:16:00 · 969 阅读 · 0 评论 -
《统计学习方法》-第二章感知机-学习总结
【感知机概述】 感知机是一种二分类的线性分类模型,对于线性可分的数据集,什么叫做线性可分数据集?对于一个数据集,存在一个超平面能够将所有正负样本完全正确的划分在超平面的两侧,就称数据集为线性可分数据集。输入空间是样本的特征向量,输出空间是{-1,1},感知机旨在求出能够将训练数据进行线性划分的超平面。感知机的学习策略是最小化损失函数,利用随机梯度下降算法完成最小化损失函数,不断优化参数,最终...原创 2019-04-08 23:49:19 · 222 阅读 · 0 评论 -
每日一道算法题--leetcode 15--三数之和--python
详解在本人的掘金博文中,下面是传送门:三数之和-传送门原创 2019-04-02 14:56:43 · 105 阅读 · 0 评论 -
GBDT讲的好的文章分享【持续更新】
1.机器学习中的算法(1)-决策树模型组合之随机森林与GBDT2.GBDT理解二三事3.Gradient boosting wiki4.GBDT算法原理以及实例理解原创 2019-03-28 11:34:25 · 166 阅读 · 0 评论 -
每日一道算法题--leetcode 704--二分查找--C++/python
传送门二分查找c++/python原创 2019-03-22 11:49:11 · 142 阅读 · 0 评论 -
每日一道算法题--leetcode 507--完美数--C++
【题目描述】【代码思路】解读题干其实就是要求一个整数的所有因数,重点有两个:1.输入数字为num,循环的判断条件是i*i<=num,这样就能避免重复计算,这很巧妙值得理解和记忆。2.sum初始值为1,i的初始值为2,这样就可以避免把num自身加上了,不用在循环中每次都判断【源代码】class Solution {public: bool checkPe...原创 2019-03-25 17:19:09 · 335 阅读 · 0 评论 -
深度学习学习笔记(一):logistic regression与Gradient descent 2018.9.16
写在开头:这是本人学习吴恩达在网易云课堂上的深度学习系列课程的学习笔记,仅供参考,欢迎交流学习!一,先介绍了logistic regression,逻辑回归就是根据输入预测一个值,这个值可能是0或者1,其图像是一条s形曲线,由预测值与真实值的差距计算出loss function损失函数和cost function成本函数,损失函数值单个样本的 效果;成本函数是用来体现整个算法的效果,是每个样本...原创 2018-09-16 22:28:14 · 828 阅读 · 0 评论 -
hive sql 小整理【持续更新】
1.查看某字段是否包含某字符串:假设有一字段,"a",是string类型的,想看a字段中是否包含某一字符串,用instr函数,若不包含,则返回0,若包含则返回该字符串所在位置,一定不为0;举个例子,#判断o字段是否包含“Android”,‘iOS’等,如果包含则对新的字段o1,o2,o3,o4,o5设置数值0或者1selectcase when ( instr('Androi...原创 2019-03-15 14:38:33 · 967 阅读 · 0 评论 -
每日一道算法题--leetcode 75--颜色分类--C++(快排)
【题目描述】【方法一:计数排序】最简单的思路是扫描一遍数组分别对三个类别的数量做个统计,然后再按照每类的数量给数组赋值即可。代码如下:class Solution {public: void sortColors(vector<int>& nums) { int left=0; int right=nums.size(...原创 2019-03-25 16:20:37 · 125 阅读 · 0 评论 -
每日一道算法题--leetcode 543--二叉树的直径--C++
【题目描述】【代码思路】这道题与我的上一篇非常相似,leetcode 687--最长同值路径可以对比着来看。由题目可见,在求最长路径时也是不能回溯的。抓住一个点理清递归函数内部逻辑,拿题目中2这个结点来看,需要把左右子树的最长路径分别求出来,分别为left,right,只要2结点的左子树不为空那么left+1,右子树不为空right+1。用一个全局变量cmax把当前最长路径保存起来,c...原创 2019-03-21 21:03:21 · 97 阅读 · 0 评论 -
每日一道算法题--leetcode 687--最长同值路径--C++
【题目描述】【代码思路】最近在做深度优先的特辑,同样是递归的还有我之前的leetcode 695--岛屿的最大面积和leetcode 872--叶子相似的树,这道题我走了一些弯路,因为理解错了题干,先看下面一个图,在我理解错误的时候,以为是只要递归的求每个结点的最长左子树同值长度与最长右子树之和就可以,那么上图的最长同值路径是从根结点26开始连接在一起同值的结点有6个,...原创 2019-03-21 21:01:21 · 349 阅读 · 0 评论 -
每日一道算法题--leetcode 872--叶子相似的树(深度优先)--C++
【题目描述】【代码思路】这又是一个深度优先的例子,先解读一下题干,其实就是想从左至右的找到一颗树的所有叶结点,而遍历一棵树的所有结点,有深度优先和广度优先,这道题显然是深度优先更合适,因为广度优先是按层遍历的,不能保证从左至右找到所有叶结点,比如这道题广度优先找到的叶结点顺序就是[6,9,8,7,4]这不符合题目要求,所以用深度优先。这种递归的题目,首先要抓住一个点理清递归的函数内...原创 2019-03-20 14:52:58 · 141 阅读 · 0 评论 -
每日一道算法题--leetcode 112--路径总和--python
【题目描述】【代码思路】做这道题首先想到的,就是遍历这棵树的所有根结点到叶结点的路径,将每条路径的和保存在一个list中,最后看list中是否含有题目给定的数据即可。遍历一棵树的所有路径,一定是要用到深度优先,写递归函数的,那么还是抓住一个点去看,就拿5这个结点来看,当递归函数输入的结点是5。那么我首先是要去判断这个结点是否有左右子树的,用一个变量sum1存放一路总和。我的递归函数...原创 2019-03-26 15:04:40 · 116 阅读 · 0 评论 -
pandas常用操作总结【持续更新】
传送门 本人掘金博文中原创 2019-03-26 22:16:31 · 137 阅读 · 0 评论 -
每日一道算法题--leetcode 437--路径总和III--python
详解在本人的掘金博文中,下面是传送门:leetcode427-路径总和III 传送门原创 2019-03-28 10:59:50 · 235 阅读 · 0 评论 -
每日一道算法题--leetcode 66--加一--python 两种方式
详解在本人掘金博文中,下面是链接:传送门原创 2019-04-06 22:36:37 · 249 阅读 · 0 评论 -
每日一道算法题--leetcode 26--删除排序数组中重复项--python
本人掘金博文,传送门在此原创 2019-04-10 17:55:25 · 76 阅读 · 0 评论 -
每日一道算法题--leetcode 113--路径总和II--python
【题目描述】【代码思路】可以对比参考我的上一篇每日一道算法题--leetcode 112--路径总和--python,整体思路与上一篇基本相似,不同之处在于要保存好路径在一个list中,在判断该路径是我们要找的路径时,把这个路径list加入到返回结果list中即可。 这里有一点需要注意,对于递归过程,如果递归函数参数是局部变量,比如下面的sum1变量,则在每次递归结束时不需要还原参数,...原创 2019-03-27 20:43:24 · 135 阅读 · 0 评论 -
每日一道算法题--leetcode 104--二叉树的最大深度--python
在本人掘金博客中传送门原创 2019-04-05 23:03:16 · 85 阅读 · 0 评论 -
pandas groupby分组并保存分组结果为dataframe
groupby 按一定条件将数据分组并按分组取得各组数据>>> 原始datframe:df Animal Max Speed0 Falcon 380.01 Falcon 370.02 Parrot 24.03 Parrot 26.0按照Animal是否为Falcon,进行分组,并取出各组datafram...原创 2019-03-26 22:37:36 · 9622 阅读 · 0 评论 -
pandas 按名称取行列 loc
loc 按名称取行列,可能是一行多行,或者一列多列,或者某行某列>>> df max_speed shieldcobra 1 2viper 4 5sidewinder 7 8取一行,返回的是一个series:df.loc['...原创 2019-03-26 22:24:13 · 1114 阅读 · 0 评论 -
pandas 按索引取行列 iloc
一.iloc 按索引取行列,可能是一行多行,或者一列多列,或者某行某列原始数据dataframe为:>>> df a b c d0 1 2 3 41 100 200 300 4002 1000 2000 3000 4000取某行:>>> df.i...原创 2019-03-26 22:18:28 · 6833 阅读 · 1 评论 -
常用机器学习数据分析画图工具--matplotlib库【持续更新】
一、散点图官方文档如下图,接下来将对常用的参数做解释:x,y:输入横纵坐标数据,维度为shape(n,)s:标记点大小,可以是固定值,即每个点大小一样;也可以是与x,y维度一致的二维数组,即每个点大小与数组对应。效果如下:c:标记点颜色,不可以是标量,可以是字符或者与x,y维度一致的二维数组,若是字符,可能是'b'表示蓝色(默认),'g'表绿色,'y'表黄色,'k'表黑色,'r...原创 2019-03-19 16:57:19 · 561 阅读 · 0 评论