自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 类与对象︱Python学习笔记

类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。【例子】class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10

2020-08-05 22:00:01 143

原创 函数与Lambda表达式︱Python学习笔记

函数与Lambda表达式1. 函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数返回值是函数函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname(parameters): "函数_文档字符串" fu

2020-08-02 21:09:29 140

原创 序列︱Python学习笔记

序列在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作,但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。1. 针对序列的内置函数list(sub) 把一个可迭代对象转换为列表。【例子】a = list()print(a) # []b = 'I Love LsgoGroup'b = list(b)print(b) # ['I', ' ', 'L', 'o', 'v', 'e', ' ', 'L', 's', 'g', 'o',

2020-07-31 20:16:02 153

原创 列表︱Python学习笔记

列表列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对

2020-07-28 20:29:10 101

原创 异常处理︱Python学习笔记

异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivision

2020-07-24 21:11:04 64

原创 条件语句︱Python学习笔记

条件语句1. if 语句if expression: expr_true_suiteif 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。【例子】if 2 > 1 and not 2 > 3: print('Correct Judgement!')#

2020-07-23 20:01:39 73

原创 变量、运算符与数据类型︱Python学习笔记

变量、运算符与数据类型1. 注释在 Python 中,# 表示注释,作用于整行。【例子】单行注释# 这是一个注释print("Hello world")# Hello world''' ''' 或者 """ """ 表示区间注释,在三引号之间的所有内容被注释【例子】多行注释'''这是多行注释,用三个单引号这是多行注释,用三个单引号这是多行注释,用三个单引号'''print("Hello china") # Hello china"""这是多行注释,用三个双引号

2020-07-22 21:02:58 95

原创 Pandas基础|综合练习︱Python学习笔记

端午节的淘宝粽子交易(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计 ×× 人付款,单价为 ××。

2020-07-01 23:11:40 160

原创 方差分析|概率统计学习笔记

方差分析1 概要方差分析(Analysis of variance, ANOVA) 主要研究分类变量作为自变量时,对因变量的影响是否是显著的。方差分析的方法是由20世纪的统计学家Ronald Aylmer Fisher在1918年到1925年之间提出并陆续完善起来的,该方法刚开始是用于解决田间实验的数据分析问题,因此,方差分析的学习是和实验设计、实验数据的分析密不可分的。实验设计和方差分析都有自己相应的语言。因此,在这里我们通过一个焦虑症治疗的实例,先了解一些术语,并且思考一下,方差分析主要用于解决

2020-06-29 22:48:06 1207

原创 Pandas基础|时序数据︱Python学习笔记

第9章 时序数据import pandas as pdimport numpy as np一、时序的创建1. 四类时间变量现在理解可能关于③和④有些困惑,后面会作出一些说明名称描述元素类型创建方式① Date times(时间点/时刻)描述特定日期或时间点Timestampto_datetime或date_range② Time spans(时间段/时期)由时间点定义的一段时期PeriodPeriod或period_range③ Date off

2020-06-29 22:39:41 276

原创 Pandas基础|分类数据︱Python学习笔记

第8章 分类数据import pandas as pdimport numpy as npdf = pd.read_csv('data/table.csv')df.head() School Class ID Gender Address Height Weight Math Physics 0 S_

2020-06-28 21:50:47 157

原创 常见分布与假设检验|概率统计学习笔记

3 常见分布与假设检验文章目录3 常见分布与假设检验1 一般随机变量1.1 随机变量的两种类型1.2 离散型随机变量1.3 连续型随机变量2 常见分布2.1 离散型分布2.1.1 二项分布(Binomial distribution)2.1.2 泊松分布(Poisson distribution)2.1.3 二项分布,泊松分布,正态分布的关系2.1.4 其他离散型随机分布几何分布(Geometric distribution)负二项分布(Negative binomial distribution)超几何

2020-06-27 23:03:01 436

原创 Pandas基础|文本数据︱Python学习笔记

第7章 文本数据import pandas as pdimport numpy as np一、string类型的性质1. string与object的区别string类型和object不同之处有三:① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型② 某些Series方法不能在string上使用,例如: Series.str.decode(),因为存储的是字符串而不是字节

2020-06-26 22:18:44 266

原创 数理统计与描述性统计|概率统计学习笔记

typora-root-url: tupian文章目录typora-root-url: tupian一、数理统计概念1.基本概念释义2.统计量与抽样3.常用的统计量二、描述性统计1.数据集中趋势的度量2. python实现3.数据离散趋势的度量4.python实现5. 分布特征6.偏度与峰度7. 公式与python实现一、数理统计概念1.基本概念释义定义:在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,.

2020-06-24 09:46:59 242

原创 Pandas基础|缺失数据︱Python学习笔记

第6章 缺失数据在接下来的两章中,会接触到数据预处理中比较麻烦的类型,即缺失数据和文本数据(尤其是混杂型文本)Pandas在步入1.0后,对数据类型也做出了新的尝试,尤其是Nullable类型和String类型,了解这些可能在未来成为主流的新特性是必要的import pandas as pdimport numpy as npdf = pd.read_csv('data/table_missing.csv')df.head() School

2020-06-23 15:35:16 277

原创 随机事件与随机变量|概率统计学习笔记

一、随机事件1.基本概念释义现实生活中,一个动作或一件事情,在一定条件下,所得的结果不能预先完全确定,而只能确定是多种可能结果中的一种,称这种现象为随机现象。​ 例如,抛掷一枚硬币,其结果有可能是出现正面,也有可能是出现反面;掷骰子游戏中,出现的数字可能是1,2,3,4,5,6其中的任意一个。以上这些现象都是随机现象。使随机现象得以实现和对它观察的全过程称为随机试验,记为**EEE**。随机实验满足以下三个条件:可以在相同条件下重复进行;结果有多种可能性,并且所有可能结果事先已知

2020-06-21 10:53:52 356

原创 零基础入门cv04︱Python学习笔记

Datawhale 零基础入门CV赛事-Task5 模型集成在上一章我们学习了如何构建验证集,如何训练和验证。本章作为本次赛题学习的最后一章,将会讲解如何使用集成学习提高预测精度。5 模型集成本章讲解的知识点包括:集成学习方法、深度学习中的集成学习和结果后处理思路。5.1 学习目标学习集成学习方法以及交叉验证情况下的模型集成学会使用深度学习模型的集成学习5.2 集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boost

2020-06-02 22:15:11 167 1

原创 零基础入门cv04︱Python学习笔记

Datawhale 零基础入门CV赛事-Task4 模型训练与验证在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够。一个成熟合格的深度学习训练流程至少具备以下功能:在训练集上进行训练,并在验证集上进行验证;模型可以保存最优的权重,并读取权重;记录下训练集和验证集的精度,便于调参。4 模型训练与验证为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解,在部分小节中将会结合Pytorch代码进行讲解。4

2020-05-30 21:16:26 134

原创 零基础入门cv03︱Python学习笔记

1.卷积神经网络(CNN)介绍一类特殊的人工神经网络,是深度学习中一个重要分支。较传统计算学习算法,精度和速度较高在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型cnn每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。cnn是一种层次模型,输入的是原始的像素数据。cnn通过卷积(convolution)、池化(pooling)、非线性激活函数(non-linear activ

2020-05-26 23:40:32 174

原创 零基础入门cv02︱Python学习笔记

数据读取与数据扩增图像读取由于赛题数据是图像数据,任务为识别图像中的字符。故我们需要完成对数据的读取操作,较常见的相关库为pillow和opencvpillow是python图像处理函式库(PIL)的一个分支。提供了常见的图像读取和处理的操作,可与ipython notebook无缝集成。from PIL import Imageim = Image.open('/Users/linyuepu/Downloads/IMG_2054.png')# 读取照片im[外链图片转存失败,

2020-05-23 22:58:50 252

原创 函数篇︱Python学习笔记

python不仅能灵活定义函数,也可以直接调用内置函数。调用内置函数需要知道函数名称和参数也可通过交互式命令查看帮助信息例如:http://docs.python.org/3/library/functions.html#abs 可通过官方文档查看abd函数的帮助信息# abs函数help(abs)Help on built-in function abs in module builtins:abs(x, /) Return the absolute value

2020-05-23 16:04:36 308

原创 零基础入门cv01︱Python学习笔记

赛题数据训练集数据包括3w张照片,验证集数据包括1w张照片,每张照片包括颜色图像和对应的编码类别和具体位置。1. 训练集mchar_train.zip,包含30000张图片。2. 验证集mchar_val.zip,包含10000张图片。3. 测试集mchar_test_a.zip,包含40000张图片。4. 提交结果模板mchar_sample_submit_A.csv5. 训练集、验证集和测试集中字符的位置mchar_train.json、mchar_val.json,为降低比赛

2020-05-20 21:51:47 242

原创 Pandas基础6.1︱Python学习笔记

2002 年-2018 年上海机动车拍照拍卖import numpy as npimport pandas as pddf = pd.read_csv('./2002年-2018年上海机动车拍照拍卖.csv')df.head() Date Total number of license issued lowest ...

2020-05-01 22:30:47 229

原创 Pandas基础5.1|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv')df.head() Unnamed: 0 School Class ID Gender Address Height ...

2020-04-30 15:34:13 213

原创 Pandas基础3.2|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv',index_col = 'ID')df.head() Unnamed: 0 School Class Gender Address Hei...

2020-04-28 11:45:54 498

原创 爬虫基础4.1|Python学习笔记

回顾selenium(自动化测试工具)应用场景:用代码的方式去模拟浏览器操作过程(如:打开浏览器、在输入框里输入文字、回车等),在爬虫方面很有必要高级-查找元素:介于打开页面和关闭页面之间,与爬虫常见的HTML页面解析、定位到具体的某个元素类似,区别在于调用者是driver高级-页面交互:找到元素后,进行“交互”,如键盘输入(需提前导入模块)高级-等待页面加载(wait):应用场景...

2020-04-27 23:13:50 108

原创 Pandas基础3.1|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv',index_col = 'ID')df.head() Unnamed: 0 School Class Gender Address Hei...

2020-04-26 23:07:48 110

原创 Pandas基础2.3|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv',index_col='ID')df.head() Unnamed: 0 School Class Gender Address Heig...

2020-04-26 15:27:52 232 1

原创 Pandas基础2.2|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv',index_col='ID')df.head() Unnamed: 0 School Class Gender Address Heig...

2020-04-26 13:29:56 125

原创 爬虫基础2.2|Python学习笔记

基于BS4库的HTML内容遍历方法HTML基本格式:<> * < / >构成了所属关系,形成了标签的树形结构标签树的下行遍历.contents 子节点的列表,将< tag >所有儿子节点存入列表.children子节点的迭代类型,与.contents类似,用于循环遍历儿子节点.descendadts子孙节点的迭代类型,包含所有子孙节点,用于循环遍历...

2020-04-25 10:55:56 102

原创 爬虫基础2.1|Python学习笔记

Beautiful Soup库的基本元素理解:Beautiful Soup库是解析、遍历、维护“标签树”的功能库,对应一个HTML、XML文档的全部内容BS是一个HTML/XML的解析器,主要用于解析和提取HTML/XML数据;基于HTML DOM,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,性能低于lxml;BS用来解析HTML较简单,API非常人性化,支持CS...

2020-04-24 17:17:09 168

原创 爬虫基础1.3|Python学习笔记

JavaScript的使用在< script >< /script >中直接编写通过< script src=‘目标文档的URL’ >< script >连接外部Js文件herf属性值作为某个元素的实践属性值或者是超链接的herf属性值JavaScript基本语法执行顺序:按照HTML文件中出现的顺序一次执行严格区别大小写忽略空...

2020-04-24 15:57:22 82

原创 爬虫基础1.2|Python学习笔记

1、使用开发者工具检查网页菜单 - 更多工具 - 开发者工具 / 右击 - 检查 / F12Elements:允许用户从浏览器的角度来观察网页。HTML、CSS、DOM(Document Object Model)对象。Network:网页向服务器请求了哪些资源、资源的大小以及加载资源的相关信息。HTTP的请求头、返回内容等。Source:源代码面板,调试JavaScriptConso...

2020-04-24 03:04:30 152

原创 Pandas基础2.1|Python学习笔记

import numpy as npimport pandas as pddf = pd.read_csv('./data/table.csv',index_col='ID')df Unnamed: 0 School Class Gender Address Height ...

2020-04-23 20:49:02 156 1

原创 爬虫基础1.1|Python学习笔记

1、Internet互联网以一组标准的网络协议组相连,形成逻辑上的单一巨大国际网络。WWW万维网是一个超文本相互链接而成的全球性系统,是Internet所能提供的服务之一。2、HTTP是一个客户端(用户)和服务器端(网站)之间进行请求和应答的标准。客户代理user agent(客户端)(HTTP请求)---->源服务器origin server(应答服务器存储资源码e.g.HTML...

2020-04-21 22:06:16 137

原创 Pandas基础1.1|Python学习笔记

【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:(a)在所有的数据中,一共出现了多少人物?import pandas as pdimport numpy as npdf = pd.read_csv('C:/Users/PuLinYue/Desktop/joyful-pandas/data/Game_of_Thrones_Script.csv')df.head()...

2020-04-20 22:18:37 550 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除