《李宏毅机器学习》task9

正在熬夜编写中。。。 使用Matplotlib注释 构造注释树

2019-06-14 20:56:10

阅读数 15

评论数 0

《李宏毅机器学习》task8

《李宏毅机器学习》task8一、决策树的模型结构二、理解递归 一、决策树的模型结构 算法 支持模型 树结构 特征选择 连续值处理 缺失值处理 剪枝 ID3 分类 多叉树 信息增益 不支持 不支持 不支持 C4.5 分类 多叉树 信息增益比 支持 支持 支持 CART 分类/...

2019-06-10 08:33:22

阅读数 32

评论数 0

《李宏毅机器学习》task7

import numpy as np import pandas as pd def cancShannonEnt(dataSet): ''' :param dataSet: dataSet :return: shannonEnt ''' # 计算公式前,注意...

2019-06-05 21:53:37

阅读数 21

评论数 0

RDD

1.用户可以使用两种方法创建RDD:读取一个外部数据集,或在驱动器程序里分发驱动器程序中的对象集合(比如list 和set)。 1.1读取一个外部数据集 在本书前面的章节中已经见过使用SparkContext.textFile() 来读取文本文件作为一个字符串RDD 的示例. lines =...

2019-06-03 20:46:39

阅读数 24

评论数 0

《李宏毅机器学习》task6

class LogisticRegression(object): def __init__(self, learning_rate=0.1, max_iter=100, seed=None): self.seed = seed self.lr =...

2019-06-02 20:01:11

阅读数 24

评论数 0

《李宏毅机器学习》task5

《李宏毅机器学习》task5推导LR损失函数(1)学习LR梯度下降(2)利用代码描述梯度下降(选做)(3)Softmax原理(4)softmax损失函数(5)softmax梯度下降(6)参考文献 推导LR损失函数(1) 假定: LR逻辑回归假设样本服从泊松0–1分布,因此p(y|x)表达...

2019-05-29 21:16:50

阅读数 21

评论数 0

《李宏毅机器学习》-task4

1.贝叶斯公式 (1)条件概率公式 设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为: P(A|B)=P(AB)/P(B) (2)乘法公式...

2019-05-25 18:47:04

阅读数 31

评论数 0

TensorFlow mnist数字识别

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 OUTPUT_NODE = 10 LAYER1_NODE = 500 BATCH_SIZE ...

2019-05-24 21:47:39

阅读数 32

评论数 0

《李宏毅机器学习》task3

'''读取数据''' data = pd.read_csv('train.csv') #DataFrame类型 del data['datetime'] del data['item'] '''整理训练集合''' ItemNum=18 X_Train=[] #训练样本...

2019-05-20 20:31:35

阅读数 13

评论数 0

《李宏毅机器学习》task2

《李宏毅机器学习》task21.偏差和方差学习误差由偏差和方差而产生过拟合,欠拟合2.鞍点,全局最优和局部最优3.梯度下降Mini-Batch与SGDBatch与Mini-Batch,SGD的区别如何根据样本大小选择哪个梯度下降写出SGD和Mini-Batch的代码4.交叉验证5.归一化6.回归模...

2019-05-17 20:21:16

阅读数 13

评论数 0

《李宏毅机器学习》task1

1.什么是机器学习 2.中心极限定理、正态分布、最大似然估计 3.线性回归loss function推导 4.损失函数和凸函数之间的关系

2019-05-13 19:20:27

阅读数 23

评论数 1

svm

SVM 的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。 SVM 的最优化算法是求解凸二次规划的最优化算法。 在高等数学中,带约束的最优化问题还可以用另一种方法求解——拉格朗日乘子法。该方法的优点一是更容易求解,而是自然引...

2019-05-13 16:52:07

阅读数 11

评论数 0

LeetCode和为S的两个数字

输入一个递增排序的数组和一个数字S,在数组中查找两个数,使得他们的和正好是S,如果有多对数字的和等于S,输出两个数的乘积最小的。 数列满足递增,设两个头尾两个指针i和j, 若ai + aj == sum,就是答案(相差越远乘积越小) 若ai + aj > sum,aj肯定不是答案之一...

2019-05-08 19:16:52

阅读数 9

评论数 0

leetcode求二叉树深度

输入一棵二叉树,求该树的深度。从根结点到叶结点依次经过的结点(含根、叶结点)形成树的一条路径,最长路径的长度为树的深度。 非递归写法:层次遍历 import java.util.Queue; import java.util.LinkedList; public class Solu...

2019-05-08 16:09:44

阅读数 5

评论数 0

python迭代器和生成器

python迭代器和生成器迭代器 迭代器 迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个...

2019-05-08 16:02:29

阅读数 8

评论数 0

PyTorch: CNN实战MNIST手写数字识别

PyTorch: CNN实战MNIST手写数字识别cnn导包加载数据构造CNN训练并计算损失结果 cnn 卷积神经网络CNN的结构一般包含这几个层: 输入层:用于数据的输入 卷积层:使用卷积核进行特征提取和特征映射 激励层:由于卷积也是一种线性运算,因此需要增加非线性映射 池化层:进行下采...

2019-04-19 15:51:23

阅读数 13

评论数 0

和为S的连续正数序列

小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100。但是他并不满足于此,他在想究竟有多少种连续的正数序列的和为100(至少包括两个数)。没多久,他就得到另一组连续正数和为100的序列:18,19,20,21,22。现在把问题交给你,你能不能也很快的找出所...

2019-04-19 14:20:17

阅读数 11

评论数 0

判断是否为平衡二叉树

最直接的做法,遍历每个结点,借助一个获取树深度的递归函数,根据该结点的左右子树高度差判断是否平衡,然后递归地对左右子树进行判断。 public classSolution { public boolean IsBalanced_Solution(TreeNode root) { ...

2019-04-19 10:55:10

阅读数 7

评论数 0

字符串转换成一个整数

字符串转换成一个整数 边界条件: 数据上下 溢出 空字符串 只有正负号 有无正负号 错误标志输出 public class Solution { public int StrToInt(String str) { if(str == null || str.leng...

2019-04-18 03:00:42

阅读数 14

评论数 0

python解决递归栈溢出的方法,尾递归

解决递归调用栈溢出的方法是通过尾递归优化,事实上尾递归和循环的效果是一样的,所以,把循环看成是一种特殊的尾递归函数也是可以的。 尾递归是指,在函数返回的时候,调用自身本身,并且,return语句不能包含表达式。这样,编译器或者解释器就可以把尾递归做优化,使递归本身无论调用多少次,都只占用一个栈帧,...

2019-04-17 16:48:17

阅读数 15

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭