深度学习
文章平均质量分 79
William_GJIN
这个作者很懒,什么都没留下…
展开
-
Pandas高级处理
一、缺失值处理1.1 缺失值处理方式1.1.1 思路1.删除含有缺失值的样本(nan)2.替换/插补1.1.2 处理nan1.判断数据中是否存在nanpd.isnull(df) 判断是否为空,是空的话置为Truepd.notnull(df) 判断是否为空,不是空的话置为True#返回True,数据中存在缺失值np.any(movie.isnull())True#返回False,数据中存在缺失值np.all(movie.notnull())Falsemovie.isnu原创 2021-01-22 22:12:28 · 243 阅读 · 0 评论 -
机器学习-Pandas
一、简介封装了Numpy和Matplotlib,具有便捷的数据处理能力,读取文件方便,专门用于数据挖掘。二、三大数据结构2.1 DataFrame2.1.1 结构既有行索引,又有列索引的二维数组1. 生成DataFramepd.DataFrame(ndarrary)import numpy as npimport pandas as pd#生成二维数组stock_change = np.random.normal(0,1,(10,5))#创建DataFramepd.DataFram原创 2021-01-21 22:19:00 · 267 阅读 · 0 评论 -
Numpy-ndarray运算
一、逻辑运算1.布尔运算 通过< , >号判断数组全部值是否符合条件,如是否大于1,大于1会置为True,小于1会置为False#生成0到1之间,8行10列均匀分布的数组stock_change = np.random.normal(0,1,(8,10))#大于0.5的值置为True,否则置为Falsestock_change > 0.5array([[False, False, False, False, False, False, False, False, Fal原创 2021-01-18 19:16:11 · 808 阅读 · 1 评论 -
分类算法:K-近邻算法
一、定义 如果一个样本在特征空间中的k个最相似,即特征空间中最邻近)的样本中的大多数属于某个类别,则该样本也属于这个类别总结:根据你的“邻居”来推断出你的类别二、距离公式1、欧式距离 a(a1,a2,a3) b(b1,b2,b3) 计算a、b两点距离: (a1−b1)2+(a2−b2)2+(a3−b3)2\sqrt{(a1-b1)^2+(a2-b2)^2+(...原创 2020-05-03 22:03:20 · 428 阅读 · 0 评论 -
特征降维-主成分分析
一、模块sklearn. feature_selection二、定义高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量使数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。**应用: **回归分析或者聚类分析当中**原理:**找到一条合适直线,通过一个矩阵计算得出主成分分析的结果三、APIsklearn.decomposition.PCA(n...原创 2020-04-28 19:20:39 · 254 阅读 · 0 评论 -
特征降维-Filter(过滤式)特征选择
一、模块sklearn. feature_selection二、过滤式1、低方差特征过滤删除低方差的一些特征,再结合方差的大小来考虑这个方式的角度特征方差小:某个特征大多样本的值比较相近特征方差大:某个特征很多样本的值都有差别1.1、APIsklearn .feature_ selection .VarianceThreshold(threshold=0.0)...原创 2020-04-28 17:59:08 · 1649 阅读 · 0 评论 -
机器学习-特征预处理:标准化
一、定义通过对原始数据进行变换把数据变换到均值为0,标准差为1范围內二、公式 示例:三、APIsklearn. preprocessing .MinMaxScaler (feature_range=(0, 1)…)o MinMaxScalar .fit_ transform(X)X为 numpy array格式的数据[n_ samples, n_ features]返回值...原创 2020-04-28 11:11:34 · 322 阅读 · 0 评论 -
机器学习-特征预处理:归一化
一、定义通过对原始数据进行变换把数据映射到(默认为[0,1])之间二、公式三、APIsklearn. preprocessing .MinMaxScaler (feature_range=(0, 1)…) o MinMaxScalar .fit_ transform(X)X: numpy array格式的数据[n_ samples, n_ features] 返回值:转换后的...原创 2020-04-23 10:07:54 · 353 阅读 · 0 评论 -
机器学习-字典、文字特征提取
一、字典特征提取1、导入包from sklearn.feature_extraction import DictVectorizer2、函数编写def dict_demo(): #字典特征提取 data = [{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'深圳','tempe...原创 2020-04-20 17:08:55 · 533 阅读 · 0 评论 -
机器学习-线性回归模型示例
一、拟合效果二、代码实现import tensorflow as tf import numpy as np import matplotlib.pyplot as plt #使用numpy生成200个随机点x_data = np.linspace(-0.5,0.5,200)[:,np.newaxis]noise = np.random.normal(0,0.02,x_data....原创 2020-04-17 16:31:11 · 355 阅读 · 0 评论 -
Anaconda 与 Tensorflow 安装及配置问题及解决
一、Anaconda配置1、安装https://www.anaconda.com/ 官网下载安装包安装即可。2、Jupyter Notebook默认工作路径配置 (1)打开 Anaconda Prompt,运行下面命令,会生成 jupyter_notebook_config.py文件jupyter notebook --generate-config (2)在生成的位置:C:\U...原创 2020-04-14 16:26:58 · 218 阅读 · 0 评论