![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
胖虎艾春辉
这个作者很懒,什么都没留下…
展开
-
pandas组队学习6:链接
第六章 连接内容来源:datawhaleimport numpy as npimport pandas as pd一、关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照姓名\color{red}{姓名}姓名和班级\color{red}{班级}班级连接成总的成绩表,又例如对企业员工的各类信息表按照员工ID号\color{red}{员工ID号}员工ID号进行连接汇总。由此可以看出,在关系型连接中,键\color{red}原创 2020-12-29 12:29:32 · 314 阅读 · 0 评论 -
二手车预测:task2:数据分布
2.1 EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或...原创 2020-03-22 22:02:14 · 18505 阅读 · 0 评论 -
二手车预测:task1:赛题分析
train.csvname - 汽车编码regDate - 汽车注册时间model - 车型编码brand - 品牌bodyType - 车身类型fuelType - 燃油类型gearbox - 变速箱power - 汽车功率kilometer - 汽车行驶公里notRepairedDamage - 汽车有尚未修复的损坏regionCode - 看车地区编码seller...原创 2020-03-21 16:39:40 · 370 阅读 · 0 评论 -
pytorch-语言模型
语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为TTT的词的序列w1,w2,…,wTw_1, w_2, \ldots, w_Tw1,w2,…,wT,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:P(w1,w2,…,wT).P(w_1, w_2, \ldots, w_T).P(w1,w2,…,wT).本节我们介绍基于统计的语言模型,主要是nnn元语...原创 2020-02-13 22:25:27 · 188 阅读 · 0 评论 -
pytorch-文本预处理
文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本我们用一部英文小说,即H. G. Well的Time Machine,作为示例,展示文本预处理的具体过程。import collecti...原创 2020-02-13 22:22:36 · 1054 阅读 · 1 评论 -
pytorch- softmax和分类模型
softmax和分类模型内容包含:softmax回归的基本概念如何获取Fashion-MNIST数据集和读取数据softmax回归模型的从零开始实现,实现一个对Fashion-MNIST训练集中的图像数据进行分类的模型使用pytorch重新实现softmax回归模型softmax的基本概念分类问题一个简单的图像分类问题,输入图像的高和宽均为2像素,色彩为灰度。图像中的4像...原创 2020-02-12 20:11:14 · 769 阅读 · 0 评论 -
pytorch-线性回归
线性回归主要内容包括:线性回归的基本要素线性回归模型从零开始的实现线性回归模型使用pytorch的简洁实现线性回归的基本要素模型为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:price=warea⋅area+wage⋅age+b\mathrm{pr...原创 2020-02-12 19:33:18 · 264 阅读 · 0 评论 -
机器学习实战- 回归(Regression) 概述
文章目录回归(Regression) 概述回归 场景回归 原理1、线性回归1.1、线性回归 须知概念1.1.1、矩阵求逆1.1.2、最小二乘法1.2、线性回归 工作原理1.3、线性回归 开发流程1.4、线性回归 算法特点1.5、线性回归 项目案例1.5.1、线性回归 项目概述1.5.2、线性回归 编写代码1.5.3、线性回归 拟合效果2、局部加权线性回归2.1、局部加权线性回归 工作原理2.2、局...原创 2020-01-28 21:15:22 · 2028 阅读 · 0 评论 -
task2数据清洗
任务2数据清洗Task02:数据清洗(2天)https://github.com/datawhalechina/team-learning/blob/master/数据竞赛(房租预测)/2_数据清洗.ipynb每一步都要认真完成,附上代码,最终效果截图缺失值分析及处理缺失值出现的原因分析采取合适的方式对缺失值进行填充异常值分析及处理根据测试集数据的分布处理训练集的数据分布使...原创 2020-01-09 16:45:34 · 271 阅读 · 0 评论 -
task1-房价预测
1. 赛题分析比赛要求参赛选手根据给定的数据集,建立模型,预测房屋租金。数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户、真实租金等。这是典型的回归预测。预测指标回归结果评价标准采用R-SquareR2(R-Square)的公式为:残差平方和:SSres=∑(yi−y^i)2SS_{res}=\sum\left(y_{i}-\hat{y}_{i}\rig...原创 2020-01-07 21:30:46 · 303 阅读 · 0 评论 -
随机森林 random forest
随机森林 random forest数据集地址概述:随机森林是指多棵树对样本进行训练并且预测的一种分类器,决策树相当于大师,通过自己在数据集中学习到的只是用于新数据的分类,三个臭皮匠,顶个诸葛亮原理:数据的随机化:使得随机森林中的决策树更普遍化一点,适合更多的场景。(有放回的准确率在:70% 以上, 无放回的准确率在:60% 以上)采取有放回的抽样方式 构造子数据集,保证不同...原创 2020-01-05 13:06:30 · 382 阅读 · 0 评论 -
Adaboost算法
Adaboost算法集成学习概述集成学习算法定义集成学习(Ensemble learning)就是讲若干个弱分类器通过一定策略组合后产生一个强分类器。弱分类器(weak Classifier)指的就是那些分类准确率只比随机猜测好一点的分类器。而强分类器(strong Classifier)的分类准确率会高很多,这里的弱和强是相对的,弱分类器也叫做基分类器分类:baggingb...原创 2020-01-03 16:26:14 · 165 阅读 · 0 评论 -
排序算法:堆排序
title: ‘排序算法:堆排序’date: 2019-12-24 15:09:06categories:算法导论tags:算法导论堆排序堆排序思路是,首先构建一个堆,然后根和叶子节点进行交换,从而达到目的堆构建算法:def build_max_heap(heap): # 构造一个堆,将堆中所有数据重新排序 heapSize = len(heap) ...原创 2019-12-24 16:03:09 · 158 阅读 · 0 评论 -
矩阵求导
转载说明转载 2019-12-01 17:28:59 · 181 阅读 · 0 评论 -
python中矩阵,数组区别
转载标志转载 2019-12-01 07:53:22 · 462 阅读 · 0 评论 -
机器学习:支持向量机(svm)
title: 机器学习:支持向量机(svm)date: 2019-11-30 22:29:07mathjax: truecategories:机器学习tags:机器学习机器学习:支持向量机(svm)代码待补充本文只讲述支持向量机(svm)的基础,不涉及任何高深东西。1. 支持向量机 作用先看一图:我们第一直觉就是在两堆点中间画一根线,分开两类点。2. 如何...原创 2019-11-30 22:33:51 · 401 阅读 · 0 评论 -
贝叶斯网络
转载标志转载 2019-11-30 21:48:23 · 203 阅读 · 0 评论 -
机器学习:逻辑回归(logistics regression)
title: 机器学习:逻辑回归(logistics regression)date: 2019-11-30 20:55:06mathjax: truecategories:机器学习tags:机器学习第5章 Logistic回归Logistic 回归 概述Logistic 回归 或者叫逻辑回归 虽然名字有回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线...原创 2019-11-30 21:30:04 · 564 阅读 · 0 评论 -
机器学习:朴素贝叶斯(naive beyes)
title: 机器学习:朴素贝叶斯(naive beyes)date: 2019-11-30 20:29:35mathjax: truecategories:机器学习tags:机器学习机器学习:朴素贝叶斯(naive beyes)借鉴概述贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后...原创 2019-11-30 20:54:07 · 931 阅读 · 0 评论 -
朴素贝叶斯
转载标志转载 2019-11-27 21:15:42 · 89 阅读 · 0 评论 -
词向量(onehot->word2vec)
转载标志转载 2019-11-25 16:57:06 · 170 阅读 · 0 评论 -
逻辑回归和损失函数推导
转载标志转载 2019-11-19 16:50:46 · 140 阅读 · 0 评论 -
机器学习:决策树(decision tree)
title: 机器学习:决策树(decision tree)date: 2019-11-16 15:23:53mathjax: truecategories:机器学习tags:机器学习文章目录什么是决策树?构建决策树熵及其有关概念构建决策树按照给定特征划分数据集选择最好的数据集划分方式递归创建决策树matplotlib注解绘制树形图决策树属性的描述树的标注保存树测试隐形演讲类...原创 2019-11-16 20:52:28 · 303 阅读 · 0 评论 -
机器学习:k邻近算法(KNN)
title: 机器学习:k邻近算法(KNN)date: 2019-11-16 20:20:41mathjax: truecategories:机器学习tags:机器学习什么是K邻近算法?工作原理是:存在一个样本数 据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据 与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集...原创 2019-11-16 20:51:40 · 428 阅读 · 0 评论 -
np.dot()函数用法
title: np.dot函数date: 2019-11-15 00:56:38categories:机器学习tags:机器学习np.dot()函数用法Numpy中dot()函数主要功能有两个:向量点积和矩阵乘法。格式:**x.dot(y) 等价于 np.dot(x,y) ———**x是mn 矩阵 ,y是nm矩阵,则x.dot(y) 得到m*m矩阵。向量点积...转载 2019-11-15 06:52:07 · 1055 阅读 · 0 评论 -
softmax函数
转载转载 2019-11-09 23:17:52 · 204 阅读 · 0 评论 -
交叉熵
[原文链接](https://blog.csdn.net/tsyccnh/article/details/79163834)转载 2019-11-09 19:41:29 · 85 阅读 · 0 评论 -
NLP-3:机器学习和模型评价初步
title: ‘NLP-3:机器学习和模型评价初步’date: 2019-11-08 23:14:24mathjax: truecategories:nlp-自然语言处理tags:nlp-自然语言处理文章目录NLP-3:机器学习和模型评价初步KNN(K-nearest neighbors,K-近邻算法)决策树模型(decision tree)决策树如何决定哪一个值或者哪一个特...原创 2019-11-09 09:01:03 · 201 阅读 · 0 评论 -
机器学习和模型评价初步
title: ‘NLP-3:机器学习和模型评价初步’date: 2019-11-08 23:14:24mathjax: truecategories:nlp-自然语言处理tags:nlp-自然语言处理文章目录NLP-3:机器学习和模型评价初步KNN(K-nearest neighbors,K-近邻算法)决策树模型(decision tree)决策树如何决定哪一个值或者哪一个特...原创 2020-02-12 20:10:07 · 129 阅读 · 0 评论 -
什么是激活函数
title: 什么是激活函数date: 2019-11-08 12:55:45mathjax: truecategories:nlp-自然语言处理tags:nlp-自然语言处理文章目录先抛开什么神经,深度之类的不好理解的东西激活函数在深度学习中是用来干什么的?我们说下分类问题那么加上激活函数(activation function)就不一样几个函数解释ReLU及其衍生函数先...转载 2019-11-08 13:37:55 · 1083 阅读 · 0 评论 -
python——day_11:模块
title: ‘python——day_11:模块’date: 2019-11-05 20:30:18categories:python基础tags:python基础文章目录一、模块的导入1.什么是模块?2.如何使用模块?3. from.....import4.模块的循环引用的问题一、模块的导入之前我们简单的使用了一下模块,并没有详细的介绍,现在我们来详细的说说1.什么是...原创 2019-11-05 22:09:21 · 241 阅读 · 0 评论 -
python——day_10:魔法方法
title: ‘python——day_10:魔法方法’date: 2019-11-05 20:08:56categories:python基础tags:python基础python——day_10:魔法方法构造和析构魔法方法总是被双下划线包围魔法方法是面向对象的python的一切# 为什么类中有时候有__init__?因为需求class Rectangle:...原创 2019-11-05 22:08:14 · 553 阅读 · 0 评论 -
吴恩达机器学习:week1
title: 吴恩达机器学习:week1date: 2019-11-03 17:41:46categories:机器学习tags:机器学习第1周文章目录第1周1.1 欢迎1.2 机器学习是什么?1.3 监督学习1.4 无监督学习总结1.1 欢迎参考视频: 1 - 1 - Welcome (7 min).mkv第一个视频主要讲了什么是机器学习,机器学习能做些什么事情。机...原创 2019-11-03 22:03:06 · 220 阅读 · 0 评论 -
模型评价初步
转载标志转载 2019-11-03 15:56:58 · 90 阅读 · 0 评论 -
sklearn中的线性模型
在skearn中,可以使用sklearn.linear_model来创建线性模型然后用fit函数去训练然后用predict去预测还可以用score函数去预测同时计算预测的准确度import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn import linear_m...转载 2019-11-03 15:37:21 · 448 阅读 · 0 评论 -
NLP-2:图搜索算法和梯度下降
title: ‘NLP-2:图搜索算法和梯度下降’date: 2019-10-31 10:52:41categories:nlp-自然语言处理tags:nlp-自然语言处理文章目录NLP-2:图搜索算法和梯度下降图搜索算法:我不会讲理论,直接从项目开始理解吧梯度下降算法(线行回归)NLP-2:图搜索算法和梯度下降图搜索算法:深度优先搜索(dfs)和广度优先搜索(bfs,...原创 2019-10-31 12:44:21 · 438 阅读 · 0 评论 -
朴素贝叶斯朴素在哪里?
朴素贝叶斯(naive Bayes classifiers)是一种分类器,在机器学习中有着广泛的应用。相信很多人知道贝叶斯定理,即所以,当我们有一组事件,我们想通过这组事件去估计一个事件C发生的概率,比如我们想估计水果的种类,如果有一组事件分别 黄,长,弯…那我们就可以判断这是一个香蕉。 尽管黄,长,弯几个事件之间可能会相互依赖,但是在朴素贝叶斯模型中,我们假设它们相互独立,这就是他的朴素之处...原创 2019-10-30 22:37:30 · 2661 阅读 · 0 评论 -
python——day_08:错误和异常
title: ‘python——day_08:错误和异常’date: 2019-10-30 22:07:28categories:python基础tags:python基础‘python——day_08:错误和异常’错误语法错误或者是解析错误异常运行期检测到的错误被称为异常大多数的异常都不会被程序处理,都以错误信息的形式展现在命令行示例:>&...原创 2019-10-30 22:28:50 · 458 阅读 · 0 评论 -
贝叶斯模型
转载标志转载 2019-10-29 22:32:49 · 166 阅读 · 0 评论 -
决策树
转载标志转载 2019-10-28 22:02:49 · 77 阅读 · 0 评论