机器学习
超人睡不着也变无奈
这个作者很懒,什么都没留下…
展开
-
算法面试复习
1.LR https://blog.csdn.net/pakko/article/details/37878837原创 2022-03-17 23:47:24 · 90 阅读 · 0 评论 -
roc & auc
https://blog.csdn.net/liweibin1994/article/details/79462554原创 2020-12-03 17:39:01 · 96 阅读 · 1 评论 -
kaggle案例
https://www.kaggle.com/gpreda/santander-eda-and-prediction原创 2020-12-01 17:39:10 · 262 阅读 · 0 评论 -
决策树的发展
https://blog.csdn.net/qq_22194315/article/details/83752321原创 2020-11-27 11:47:16 · 531 阅读 · 0 评论 -
sklearn
1.sklearn中的svm https://blog.csdn.net/qq_16953611/article/details/82414129转载 2019-05-16 10:26:10 · 144 阅读 · 0 评论 -
sklean中决策树的可视化
from sklearn.datasets import load_iris from sklearn import tree import graphviz import sys import pydotplus def visualize(clf,path): dot_data = tree.export_graphviz(clf, out_file=None) graph...原创 2019-04-09 15:56:19 · 137 阅读 · 0 评论 -
机器学习中的分类算法以及实际使用
1.决策树 详情参考: https://blog.csdn.net/XINGBAIDE/article/details/85557138 2.随机森林 from sklearn.ensemble import RandomForestClassifier n_estimators_options =[10,30,50,55,58,60,65,70,80,90,100,110,120,125,130...原创 2019-04-11 09:50:58 · 464 阅读 · 0 评论 -
项目常用技巧
1.样本不均衡 过采样或者下采样 下采样: 让样本同样少 过采样: 生成数据使得样本一样多 SMOTE算法: 2.保持各特征分布有差不多的范围: 保证不同特征的取值跨度相同,保持重要程度相同 3.交叉验证 训练集 验证集 测试集 交叉验证:求稳 比如,训练集拆成3份,1+2-》训练,3验证,1+3-》训练,2验证,2+3训练,1验证 再求平均 4.模型评估方法 精度 num(y^=y)/nu...原创 2019-01-01 21:41:22 · 148 阅读 · 0 评论 -
决策树算法.实战.保存
简单记录下学习关于决策树的学习笔记 只有大体概念,不涉及细节 首先介绍熵的概念 熵用来表示数据混乱的程度 打比方: 熵高:比如义乌批发城,什么东西都有 熵低:比如苹果专卖店,只有苹果的产品 熵的计算公式 解释:如果pi(事件i发生的概率)越大,也就越接近1,取log之后,|logpi|也就越小了,而事件发生的可能性越低,pi就越接近0,取log之后 |logpi| 就越大, 0-1之间取log是...原创 2019-01-01 20:04:04 · 485 阅读 · 0 评论 -
Logistic回归
Logistic regression 经典简单的二分类方法 Sigmoid函数 函数图像: 这样可以把 负无穷到正无穷的x 映射到 0-1中 把之前的theta * x 当成z输入到sigmoid函数中 Theta * x 即theta0 * x0 + theta1* x1 + … +theta n * xn 这样我们h(x)最后得到的就是一个0-1之间的概率值了 如果是分类问题,我们就可...原创 2018-12-31 00:00:19 · 154 阅读 · 0 评论 -
梯度下降
梯度下降其实不难 建议大家是去看吴恩达的视频 很好懂 我这里就随笔记录一下了 梯度下降总目标: 即loss值,所有真实label和预测出来的结果之间的误差的总和 需要更改theta 即h(x)里的参数使得上式变小,在线性回归中我们介绍了可以直接求解 但不是所有问题都可以直接求解的 这里的话,梯度下降的思想就是,进行求导,参数沿着偏导方向移动,则可以最快的减小目标函数值,导数的方向是变化得最快的对...原创 2018-12-30 23:14:40 · 257 阅读 · 0 评论 -
线性回归
算是学习笔记 搞深度学习也大半年了 依旧有云里雾里的感觉 再把基本的知识过一下 也记录一下 学习资源来自网易云课堂唐宇迪的视频材料,如有侵权,请告诉我 转载请附上出处 简单的线性回归问题不用赘述了 假设输入x为x1,x2 则参数为theta1,theta2,bias 把bias当为theta0,则置x0为1 则可以矩阵表示为 Y(预测)=theat * x 对吧 但是计算的超平面和实际的y是有区...原创 2018-12-30 00:06:47 · 172 阅读 · 0 评论 -
matplotlib画图基本使用
会记录一些最基本的matplotlib的使用方法,画一些诸如,条形图,折线图,散点图等 直接上代码,注释应有尽有… 也算是是学习唐宇迪课程的笔记 import pandas as pd import numpy as np unrate=pd.read_csv("pandas_data/unrate.csv") unrate['DATE']=pd.to_datetime(unrate['DATE'...原创 2018-12-29 23:52:45 · 213 阅读 · 0 评论