自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 数据分析入门-Task04:数据可视化

数据分析入门-Task04:数据可视化2 第二章:数据可视化2.7 如何让人一眼看懂你的数据?2.7.1 可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。2.7.2 可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图。2.7.3 可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图表示)(横轴是不同票价,纵轴是存活人数)2.7.4 可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。2.7.5 可视化展示泰坦尼克号数据集中不同年龄的人生存与

2020-08-25 21:16:43 261

原创 数据分析入门-Task03:数据重构

文章目录数据分析入门-Task03:数据重构2 第二章:数据重构2.4 数据的合并2.4.1 将data文件夹里面的所有数据都载入,观察数据的之间的关系2.4.2:使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_up2.4.3 使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的result_up和resul

2020-08-23 22:29:26 176

原创 数据分析入门-Task02:数据清洗及特征处理

数据分析入门Task02:数据清洗及特征处理第二章:数据清洗及特征处理2.1 缺失值观察与处理2.1.1 缺失值观察2.1.2 对缺失值进行处理2.2 重复值观察与处理2.2.1 查看数据中的重复值2.2.2 对重复值进行处理2.2.3 将前面清洗的数据保存为csv格式2.3 特征观察与处理2.3.1 对年龄进行分箱(离散化)处理2.3.2 任务二:对文本变量进行转换2.3.3 从纯文本Name特征里提取出Titles的特征(所谓的Titles就是Mr,Miss,Mrs等)【回顾&引言】那么在这里

2020-08-21 20:36:48 354 1

原创 机器学习入门:基于逻辑回归的分类

逻辑回归的定义简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。 注意,这里用的是“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘。那么逻辑回归与线性回归是什么关系呢?逻辑回归(Logistic Regressi

2020-08-21 00:02:53 430 1

原创 数据分析入门 Task01:数据载入及初步观察

复习:这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。这里有两份资料:教材《Python for Data Analysis》和 baidu.com &google.com(善用搜索引擎)1 第一章:数据载入及初步观察1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/o

2020-08-20 00:07:30 1056

原创 Python 编程基础09:文件与文件系统

目录Python 编程基础09:文件与文件系统OS 模块中关于文件/目录常用的函数序列化与反序列化Python 编程基础09:文件与文件系统打开文件open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。

2020-08-08 23:34:20 92

原创 Python 编程基础08:模块与datetime模块

Python 编程基础08:模块与datetime模块模块模块定义命名空间Datetimedatetime类date类time类timedelta类模块模块定义Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 python 标准库的方法。容器 -> 数据的封装函数 -> 语句的封装类 ->

2020-08-08 12:12:02 163

原创 Python 编程基础07:类、对象与魔法方法

Python 编程基础07:类、对象与魔法方法类与对象1.对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。继承:子类自动共享父类之间数据和方法的机制多态:不同对象对同一方法响应不同的行动2. self 是什么?Python 的 self 相当于 C++ 的 this 指针。类

2020-08-06 00:21:26 108

原创 零基础入门NLP - 新闻文本分类-Task6:基于深度学习的文本分类3

零基础入门NLP - 新闻文本分类-Task6:基于深度学习的文本分类3学习目标了解了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetuneTransformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分。他们结构完全相同,但是并不共享参数,每一

2020-08-04 23:16:25 152

原创 Python 编程基础06:函数与Lambda表达式

Python 编程基础06:函数与Lambda表达式先打卡,内容后补上。

2020-08-02 23:24:57 89

原创 零基础入门NLP - 新闻文本分类-Task5:基于深度学习的文本分类

零基础入门NLP - 新闻文本分类-Task5:基于深度学习的文本分类2该任务是用Word2Vec进行预处理,然后用TextCNN和TextRNN进行分类。TextCNN是利用卷积神经网络进行文本文类,TextCNN是用循环神经网络进行文本分类。1.Word2Vec文本是一类非结构化数据,文本表示模型有词袋模型(Bag of Words)、主题模型(Topic Model)、词嵌入模型(Word Embedding)。词嵌入是一类将词向量化的模型的统称,核心思想是将每个词都映射成低维空间上的一个稠密

2020-08-02 22:50:21 347

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除