![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 94
机器学习,深度学习,模型训练相关
聪少少灬
欲戴皇冠,必承其重!
展开
-
读书笔记 --《算法图解》
1. 大O表示法算法的运行时间用大O表示法表示大O运行时间转换为操作数算法的速度指的并非时间,而是操作数的增速(随着输入的增加,其大O运行时间将以什么样的速度增加)快到慢函数函数O(1)常量时间,哈希O(log2(n))对数时间,二分查找O(n)线性时间,简单查找O(nlog2(n))快速排序O(n2)选择排序(冒泡)O(n!)旅行商问题说明:1. 旅行商前往n个城市,确保旅程最短。求可能的排序:n!种可能方案2. 仅当原创 2021-05-09 18:16:16 · 1280 阅读 · 11 评论 -
机器学习(一) ----基础知识
组成主要任务分类(classification): 将实例数据划分到合适的类别中。应用实例: 判断网站是否被黑客入侵(二分类 ),手写数字的自动识别(多分类)回归(regression): 主要用于预测数值型数据。应用实例: 股票价格波动的预测,房屋价格的预测等。分类1. 监督学习(supervised learning)必须确定目标变量的值,以便机器学习算法可以发现特征和目标变量之间的关系。在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着原创 2021-03-19 16:30:25 · 1158 阅读 · 0 评论 -
get_dummies用于机器学习的特征处理
分类特征有两种:普通分类:性别、颜色顺序分类:评分、级别对于评分,可以把这个分类直接转换成1、2、3、4、5表示,因为它们之间有顺序、大小关系但是对于颜色这种分类,直接用1/2/3/4/5/6/7表达,是不合适的,因为机器学习会误以为这些数字之间有大小关系get_dummies就是用于颜色、性别这种特征的处理,也叫作one-hot-encoding处理比如:男性:1 0女性:0 1这就叫做one-hot-encoding,是机器学习对类别的特征处理...原创 2020-12-09 16:48:19 · 993 阅读 · 0 评论 -
寻找最影响预测结果的特征
导入相关的包import pandas as pdimport numpy as np# 特征最影响结果的K个特征from sklearn.feature_selection import SelectKBest# 卡方检验,作为SelectKBest的参数from sklearn.feature_selection import chi2导入数据df = pd.read_csv("./datas/titanic/titanic_train.csv")df = df[["Pa.原创 2020-12-09 16:40:49 · 465 阅读 · 0 评论 -
Sklearn实现泰坦尼克存活率预测
实例目标:实现泰坦尼克存活预测处理步骤:输入数据:使用Pandas读取训练数据(历史数据,特点是已经知道了这个人最后有没有活下来)训练模型:使用Sklearn训练模型使用模型:对于一个新的不知道存活的人,预估他存活的概率# 步骤1:读取训练数据import pandas as pddf_train = pd.read_csv("./datas/titanic/titanic_train.csv")df_train.head()# 我们只挑选两列,作为预测需要的特征featur原创 2020-12-09 16:27:48 · 173 阅读 · 0 评论 -
归一化处理----对数值列按分组的归一化
归一化概念将不同范围的数值列进行归一化,映射到[0,1]区间好处更容易做数据横向对比,比如价格字段是几百到几千,增幅字段是0到100;同时机器学习模型学的更快性能更好公式代码示例# 实现按照用户ID分组,然后对其中一列归一化def ratings_norm(df): """ @param df:每个用户分组的dataframe """ min_value = df["Rating"].min() max_value = df["Rating"].m.原创 2020-12-09 16:03:40 · 830 阅读 · 0 评论