小白的算法之路
本专栏主要介绍笔者的机器学习算法研究,从简单实现到优化
小糖宝
湖北的詹密 哈哈哈哈
展开
-
Stacking算法讲解
这里写自定义目录标题stacking算法作为kaggle上常用的一种算法,个人在网上查看了很多博客,都没有彻底明白,最近在知乎上找到了一篇讲解很清楚的stacking算法。https://zhuanlan.zhihu.com/p/25836678...转载 2020-12-21 17:25:32 · 6600 阅读 · 2 评论 -
Sklearn 特征选择方法(Filter、Wrapper、Embedded)
https://blog.csdn.net/weixin_41521681/article/details/86500616#%E7%89%B9%E5%BE%81%E9%80%89%E6%8B%A9%20(feature_selection)转载 2020-07-29 16:44:28 · 1042 阅读 · 0 评论 -
python imblearn 处理样本不平衡,svm验证
参考地址:https://blog.csdn.net/tonydz0523/article/details/843258231.样本分布不均的解决方法:1.1 .过采样 通过增加分类中样本较少的类别的采样数量来实现平衡,最直接的方法是简单复制小样本数据时加入随机噪声、干扰数据等。1.2 .欠采样(下采样) 通过减少分类中多数类样本的数量来实现样本均衡,最直接的方法是随机去掉一些多数类样本来减小多数类的规模,缺点是会丢失多数类中的一些重要信息。1.3 .设置权重 对不同样本数量的类别赋.原创 2020-07-22 18:18:02 · 693 阅读 · 0 评论 -
算法小白的第一次尝试----tensorflow 2.0处理同心圆数据
import tensorflow as tfimport pandas as pdimport numpy as npfrom matplotlib import pyplot as plt#数据载入df = pd.read_csv('./dot.csv')x_data = df[['x1','x2']]y_data = df['y_c']#转为numpy数组|x_data ...原创 2020-04-24 17:30:19 · 4112 阅读 · 0 评论 -
算法小白的第一次尝试---tensorflow2.0实战iris
import tensorflow as tfimport sklearn.datasets as datasetsimport numpy as np## 1.加载数据集x_data = datasets.load_iris().data #加载featuresy_data = datasets.load_iris().target #加载label# 随机切分数据,此处需设置...原创 2020-04-22 18:16:25 · 4230 阅读 · 0 评论 -
算法小白的第二次尝试----NavieBayes
>朴素贝叶斯原理见该博客(强烈推荐):>https://mp.weixin.qq.com/s?src=11×tamp=1584688625&ver=2227&signature=O754zhc6apcSqOgNLOcewFs6K3RMvj9Tuz1nB4I*-IfaZLh5wlbpKA8iJxFtQ*xLy3FoYyW*pB2t7puAhrS7WS...原创 2020-03-23 20:10:50 · 4015 阅读 · 0 评论 -
算法小白的第一次尝试---判断点是否在不规则区域范围内(手撕)
针对如何判断点是否在某一个不规则封闭区域内,主要采用的是向量积法,算法原理参考:> https://blog.csdn.net/ezhchai/article/details/78864336?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-tas...原创 2020-03-08 15:37:24 · 4800 阅读 · 0 评论 -
算法小白的第一次尝试---KNN
import scala.io.Sourceimport scala.collection.mutable.ArrayBufferimport org.apache.spark.ml.feature.LabeledPointimport org.apache.spark.ml.feature.LabeledPointimport org.apache.spark.ml.linalg.Vec...原创 2019-01-09 20:04:28 · 10221 阅读 · 0 评论 -
算法小白的第一次尝试---KPCA(核主成分分析)降维【实例对比分析PCA、LDA和KPCA】
-------------------------------------------------------------------------------------笔者追求算法实现,不喜欢大篇幅叙述原理,有关KPCA理论推荐查看该篇博客https://blog.csdn.net/zjuPeco/article/details/77510981 PCA降维欢迎前往笔者上一篇博客:ht...原创 2019-04-29 16:18:18 · 13641 阅读 · 6 评论 -
算法小白的第一次尝试---LDA(线性判别分析)降维 【适用于任何维度】
import breeze.linalg.DenseMatriximport org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.{LabeledPoint,VectorAssembler}import org.apache.spark.ml.linalg.Vectorsimport org.apache.s...原创 2019-04-24 22:35:30 · 10202 阅读 · 0 评论 -
算法小白的第一次尝试---PCA(主成分分析)降维【适合各种纬度数据】
import breeze.linalg.{Axis, DenseMatrix, eigSym, sum} import org.apache.log4j.{Level, Logger} ...原创 2019-04-16 13:28:28 · 11363 阅读 · 0 评论 -
算法小白的第一次尝试---DBCSAN实现(手撕)
import org.apache.log4j.{Level, Logger}import org.apache.spark.sql.SparkSessionimport scala.collection.mutableimport scala.collection.mutable.ArrayBuffer/** * @author XiaoTangBao * @date 2019/...原创 2019-04-10 22:05:13 · 10037 阅读 · 7 评论 -
算法小白的第一次尝试---多元线性回归
import org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.VectorAssemblerimport org.apache.spark.sql.types.{DoubleType, StructField, StructType}import org.apache.spark.sql.{DataFram...原创 2019-03-20 23:03:55 · 4727 阅读 · 0 评论 -
算法小白的第一次尝试---Kmeans (适用于任何维度数据)
import org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.VectorAssemblerimport org.apache.spark.sql.types._import org.apache.spark.sql.{DataFrame, Row, SparkSession}import scala.c...原创 2019-03-18 21:54:34 · 10708 阅读 · 0 评论 -
算法小白的第一次尝试---BoostingTree(手撕提升树)
import org.apache.spark.ml.feature.LabeledPointimport org.apache.spark.ml.linalg.Vectorsimport scala.collection.mutable.ArrayBuffer/** * @author XiaoTangBao * @date 2019/3/10 16:00 * @version...原创 2019-03-11 09:29:22 · 9753 阅读 · 0 评论 -
算法小白的第一次尝试---AdaBoost(手撕)
特别警告:https://www.wandouip.com/t5i28437/ 希望该网站尊重原创,转载请标明出处。import org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.LabeledPointimport org.apache.spark.ml.linalg.Vectorsimport org...原创 2019-03-09 22:37:39 · 9943 阅读 · 0 评论 -
算法小白的第一次尝试---SVM实现
import org.apache.log4j.{Level, Logger}import org.apache.spark.mllib.classification.{SVMModel, SVMWithSGD}import org.apache.spark.mllib.evaluation.{BinaryClassificationMetrics, MulticlassMetrics}im...原创 2019-03-07 15:24:16 · 9690 阅读 · 0 评论 -
算法小白的第一次尝试---PLA(感知机算法)实现
import breeze.linalg.DenseVectorimport org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.LabeledPointimport org.apache.spark.ml.linalg.Vectorsimport org.apache.spark.sql.SparkSess...原创 2019-03-06 10:59:20 · 9851 阅读 · 0 评论 -
算法小白的第一次尝试--LinearRegression
import org.apache.log4j.{Level, Logger}import org.apache.spark.ml.feature.VectorAssemblerimport org.apache.spark.ml.regression.{LinearRegression, LinearRegressionModel}import org.apache.spark.sql.{...原创 2019-03-04 16:13:14 · 9718 阅读 · 0 评论 -
算法小白的第一次尝试---ID3实现决策树
package DecesionTreeimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.sql.SQLContextimport org.apache.spark.ml.feature.StringIndexerimport java.math._i...原创 2019-01-17 12:54:31 · 9357 阅读 · 0 评论 -
算法小白的第一次尝试---ID3(Decision Tree)
package DecesionTreeimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.sql.SQLContextimport org.apache.spark.ml.feature.StringIndexerimport java.math._i...原创 2019-01-15 20:19:18 · 3974 阅读 · 0 评论 -
算法小白的第一次尝试---朴素贝叶斯
package Bayesimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport scala.collection.mutable.ArrayBufferimport org.apache.spark.ml.feature.LabeledPointimport org.apache.spark...原创 2019-01-12 19:17:24 · 9341 阅读 · 0 评论