![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
_BOTAK_
saying less doing more
展开
-
推荐系统(特征处理)
摘要“数据与特征决定了一个模型的上限,而模型算法的目的则为逼近这个上限”对于特征一般的处理流程是|:特征提取->特征清洗–>特征处理–>特征监控特征工程的一些处理方法:数值特征处理:方法一:无量纲处理:无量纲化使得不同规格的数据转换成为到同一规格。常见的无量纲化处理包括标准化与区间缩放法;一般而言,标准化的前提是特征服从正态分布,经过标准化后,将其转换为标准正态分布。...原创 2019-05-05 14:55:42 · 1526 阅读 · 0 评论 -
机器学习(所需要的基础数学知识)
写这篇文章的主要目的就是记录一下自己在深度学习的旅程中所需要的数学知识,通过这样的方式来记录一下我的学习生活,同时也希望自己的这份博客能够帮助初步进入机器学习领域的同学。向量向量点积:向量点积也被称之为数量积,是向量与向量之间相乘的结果,其结果是一个标量a⃗⋅b⃗=∣a∣∣b∣cosθ\vec{a} \cdot \vec{b} = |a||b|cos\thetaa⋅b=∣a∣∣b∣cosθ,在...原创 2019-05-16 16:03:22 · 1851 阅读 · 1 评论 -
The Data integration and The Datacleaning(chapter 5)
Data Integration and Data Cleaning#coding:utf-8import pandas as pdimport numpy as npsample = pd.DataFrame(np.random.randn(4,5),columns = [‘a’,‘b’,‘c’,‘d’,‘e’])print(sample)choose column asampl...原创 2019-05-18 21:09:54 · 151 阅读 · 0 评论