自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 机器学习系列2-监督学习

监督学习是最常用也是最成功的机器学习类型之一。本节介绍几种常用的监督学习算法。每当想要根据给定输入预测某个结果,并且还有输入/输出对的示例时,都应该使用监督学习。输入/输出对构成了训练集,用它来构建机器学习模型。通常需要人力来构建训练集。1. 分类与回归监督学习的问题主要有两种,分类(classification)和回归(regression)。分类问题有时可分为二分类(binary classification)和多分类(multiclass classification)。二分类问题中,

2020-12-29 14:32:52 1030

原创 机器学习系列1-引言及相关概念

1.机器学习是什么?机器学习(machine learning)是从数据中提取知识,是统计学、人工智能和计算机科学交叉的研究领域,也被称为预测分析(predictive analytics)或统计学习(statistical learning)。2.为何选择机器学习?...

2020-12-18 13:21:49 221

原创 《利用python进行数据分析》Chapter 8

本章主要内容为对存在于不同文件的数据或者以不易于进行分析的格式存储的数据进行数据联合、连接以及重新排列。

2020-02-28 11:51:35 270

原创 如何查看python版本匹配的whl格式

如下图:

2020-02-28 10:04:31 4115

原创 《利用Python进行数据分析》Chapter 7

在数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。这样的工作占了分析师80%以上的时间。本章内容主要讲解pandas中用于缺失值、重复值、字符串操作和其他分析数据转换的工具。1. 处理缺失值pandas对象的所有描述性统计信息默认情况下是排除缺失值的。对于数值型数据,pandas使用浮点值NaN来表示缺失值,所以NaN是容易检测到的标识值。1.1 过滤缺失值...

2020-02-27 11:20:43 576

原创 《利用Python进行数据分析》Chapter 6

本章主要介绍pandas对数据分输入和输出。通常有以下几种类型:读取文本文件及硬盘上其他更高效的格式文件、从数据库载入数据、与网络资源进行交互(比如Web API)。1. 文本格式数据的读写使用最多的函数:read_csv : 从文件、URL或文件型对象读取分隔好的数据,默认分隔符是逗号read_table: 从文件、URL或文件型对象读取分隔好的数据,默认分隔符是制表符(’\t’)re...

2020-02-24 10:07:07 304

原创 《利用Python进行数据分析》Chapter 5

本章主要介绍pandas数据结构和基本操作。Numpy适合处理同质型的数值类数组数据,而 pandas是用来处理表格型或异质型数据的,经常和其他数值计算工具,比如NumPy和Scipy,以及可视化工具matplotlib一起使用的。1.数据结构1.1 Series1.1.1 一种一维的数组型对象,包含了一个值序列,并且包含了数据标签,即索引。obj = pd.Series([4, 5, ...

2020-02-22 14:09:28 320

原创 《利用python进行数据分析》Chapter 4

本章着重介绍NumPy基础知识。由于NumPy提供了一个非常易用的C语言API,可以将数据传递给用底层语言编写的外部类库,再由外部类库将计算结果按照NumPy数组的方式返回。这个特征使得Python可以对存量C/C++/Fortran代码库进行封装,并为这些代码提供动态、易用的接口。NumPy对含有大量数组的数据非常有效。NumPy在内部将数据存储在连续的内存块上,这与其他的Python...

2020-02-17 17:40:11 327

原创 《利用python进行数据分析》Chapter 3

本章主要介绍python的常用数据结构以及函数的用法。1. 数据结构和序列1.1 元组1. 一种固定长度、有序且不可变的python对象序列。tup = (4,5,6)2. 支持+号连接以及*号直接复制多个。1.2 列表1. 有序、可变。2. append 尾部增加元素,insert 指定位置插入元素,后者比前者计算代价更高。3. pop 将特定位置的元素移除并返回该元素。...

2020-02-16 00:24:07 184

原创 《利用Python进行数据分析》Chapter 2

本章内容主要介绍了ipython的常用命令以及python语言基础知识。1. Ipython基础特点相比于python自带的ide,ipython可读性更好一点,支持tab键补全(命名空间以及输入历史等),以及执行任意代码块(通过复制粘贴)和整个python脚本的功能。内省变量名的前后使用?可以显示一些关于该对象的概要信息。对函数使用?来显示文档字符串,使用??来显示函数的源代码。?...

2020-02-15 16:20:31 463

原创 《利用Python进行数据分析》Chapter 1

本章内容为全书学习的准备工作,主要介绍了一下部分内容。1. 数据的类型表格型数据多维数组(矩阵)相关联的多张表(主键和外键)时间序列2. Python进行数据分析的优缺点解释型语言、胶水语言效率低全局解释器锁(GIL)3. 重要的Python库(数据科学相关)Numpy描述待补充。下同。PandasmatplotlibIpython和jupyterScipysci...

2020-02-14 17:08:38 112

原创 cmd进入指定目录

方法一:分两步,首先进入相应盘:C:\Users\xxxx>d:然后进入相应目录:D:>cd testD:\test>方法二:使用cd命令直接进入目录C:\Users\xxxx>cd /d d:\testD:\test>注意:如果不加/d参数则会出错。...

2020-02-13 16:50:07 385

转载 Python字符串格式化的方法

转载

2020-01-09 09:45:53 85

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除