自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 python现状与背景

python 诞生Python的创始人为吉多*范罗苏姆(Gudio van Rossum)1982年,Guido从阿姆斯特丹大学获得了数学和计算机硕士学位,尽管他算得上是一位数学家,但他更加享受计算机带来的乐趣。在他所生活的那个年代的编程语言,比如Pascal、C、Fortran等语言,其设计的基本原则是让机器运行的更快。当然,这样的语言对于编写程序的人来说,肯定是不够友好的,Guido希望有一种语言,这种语言能够像C语言那样,能够全面调用计算机的功能接口,又可以像shell那样,可以轻松的编程。19

2021-06-17 10:26:14 3910

原创 爬虫基础

爬虫前奏爬虫的实际例子1.搜索引擎(百度、谷歌、360)2.伯乐在线(获取全网资源)3.惠惠购物助手(可以看到历史价格)4.数据分析与研究(数据冰山知乎专栏)5.抢票软件等什么是网络爬虫1.通俗理解:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。2.专业介绍:百度百科。通用爬虫和聚焦爬虫1.通用爬虫:通用爬虫是搜索引擎抓取系统〈百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份

2021-05-23 22:09:17 138

原创 数据聚合与分组运算

数据聚合与分组运算分组与聚合的原理分组:使用特定的条件将原数据划分为多个组聚合:对每个分组中的数据执行某些操作(如聚合、转换等),最后将计算的结果进行整合分组和聚合的步骤分为三步:拆分:将数据集按照一些标准拆分成若干个组,拆分操作是在指定轴上进行的,既可以对横轴方向上的数据进行分组,也可以对纵轴上的数据进行分组应用:将某个函数或方法应用到每个分组合并:将产生的新值整合到结果对象中通过gropby()方法将数据拆分成组df1.groupby(by=None,

2021-03-15 16:14:19 1210

原创 数据预处理(纯干货,适合小白学习)

数据预处理数据清洗数据清洗目的:将脏数据(这里指是对数据分析没有意义、格式非法、不在指定范围的数据)清洗干净,是原数据具有完整性、唯一性、权威性、合法性、一致性等特点。pandas常见数据清洗:空值和缺失值的处理,重复值的处理,异常值的处理,统一数据格式。空值和缺失值的处理空值:数据未知,不适用或将在以后添加数据。None缺失值:数据集中或某些属性的值是不完整的,产生的原因主要有人为原因和机械原因,机器原因是由于机械故障未能是搜集或存储失败,认为原因是由主观失误或有意隐瞒造成。NaN使用

2021-03-15 09:03:51 1998

原创 Pandas(3)

层次化索引的操作有关层次化索引的操作由三种:选取子集操作,交换分层顺序和排序分层。选取子集操作ser_obj = Series([50,60,40,94,63,101,200,56,45],index=[['小说','小说','小说','散文随笔', '散文随笔','散文随笔','传记','传记','传记'],

2021-03-10 11:01:37 178

原创 Pandas(2)

索引操作series类对象属于一维结构,只有行索引,儿dataframe类对象属于二维结构,他同时拥有行索引和列索引,所以他们的索引操作也有所不同series的索引操作既可以通过索引的名称获取也可以通过索引的位置来获取ser_obj = pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])ser_obj[0] # 通过索引位置进行获取数据ser_obj['a'] #通过索引名称进行获取out:1切片:使用位置进行切片和列表

2021-03-10 08:26:54 729

原创 Pandas(1)

pandas的数据结构分析分为series和DataFrame,其中series是一维的数据结构,DataFrame是二维的表格型的数据结构seriesseries是一个一维数组的对象,他能保存任何类型的数据,主要是由一组数据和与之相关的索引两部分组成在Pandas中series对象可以通过pd.Series(data=None,index=None,dtapy=None,name=None,copy=False,fastpath=Falsa)创建header 1header

2021-03-08 16:56:03 230 2

原创 Numpy(三)

科学计算库numpy(3)利用numpy数组进行数据处理将条件逻辑转为数组运算Numpy的where函数是三元表达式x if condition else yimport numpy as nparr_x = np.array([1,5,7])arr_y = np.array([2,4,6])arr_con = np.array([True,False,True])result = np.where(arr_con,arr_x,arr_y)resultOUT:array([1, 4,

2021-03-08 10:30:22 657 3

原创 Numpy(二)

科学计算库Numpy(2)Numpy通用函数常见的一元通用函数函数描述abs fabs计算整数浮点或复数的绝对值aqrt计算各元素的平方根squart计算各元素的平方exp计算各元素的指数e的x方log log10 log2 loglp分别为自然对数(底数为e) 底数为10的log 底数为2的log log(1+x)sign计算各元素的正负号 1(正数) 0(零) -1(负数)ceil计算各元素的celling值 既大于或者等于

2021-03-05 16:00:39 128 2

原创 Numpy(一)

科学计算库认识Numpy数组对象numpy中最重要的一个特点就是其N维数组对象(ndarray对象别名array对象),该对象具有矢量算数能力和复杂的广播能力,可以执行一些科学计算。不同于Python标准库,ndarray对象拥有对高维数组的处理能力,这也是数值计算中缺一不可的重要特征。ndarray对象属性array.ndim 维度array.shape (n,m)array.size 数组元素的总个数既shape的nm乘积array.dtype 数组中元素类型array.item

2021-03-03 16:31:12 616 4

原创 数据分析概述

数据分析概述信息数量爆炸 大数据时代数据来源互联网(社交 搜索 电商) 移动互联网(微博) 物联网(传感器 智慧地球)车联网 GPS 医学影像 安全监控 金融(银行 股市 保险) 电信(通信 短信)作用帮助企业和个人预测未来的趋势和行为,使得商务和生产生活具有前瞻性(淘宝推送)什么是数据分析数据分析就是使用适当的统计分析方法(如聚类分析、相关分析等)对收集来的大量数据进行分析,从中提取有用的信息和规律形成结论,并加以详细研究和概括总结的过程数据分析的目的在于将隐藏在一大批看似

2021-03-02 15:18:14 348

原创 Python列表内置方法整合(纯干货)

1列表(list),Python中最基本的数据结构,也是最常使用的数据结构。它是可变的,包括长度和元素都可以变换,也就是初始化后还可以对里面的元素进行更改,里面元素可以放任意类型数据。列表使用方括号。lq_lst = list()初始化空列表lq_lst =[]初始化空列表lq_lst =[1,2,3]初始化非空列表4)使用range函数初始化非空列表:访问列表中元素,lq_lst=[‘1q’,1,2019,’sight’],如果需要访问列表lq_lst中的第一个元素,la_lst[o];如果需

2021-01-14 19:35:14 156

原创 python关键字(纯干货)

Python关键字[‘False’, ‘None’, ‘True’, ‘and’, ‘as’, ‘assert’, ‘async’, ‘await’, ‘break’, ‘class’, ‘continue’, ‘def’, ‘del’, ‘elif’, ‘else’, ‘except’, ‘finally’, ‘for’, ‘from’, ‘global’, ‘if’, ‘import’, ‘in’, ‘is’, ‘lambda’, ‘nonlocal’, ‘not’, ‘or’, ‘pass’, ‘r

2020-12-09 18:16:41 146 2

原创 Python字典(纯干货)

字典创建新字典{key1:value1,key2:value2}1)定义2,关于键和值1)键可以是整数,浮点数,字符串,元组,布尔 ,None 不可 可变2)列表和字典不允许做键值3)键值重复,后面的覆盖前面的4)值可以是任意类型,也可以相同,也可以是None3,操作len() 长度d.clear() 清空元素d.pop(“a...

2020-02-14 18:48:32 95

原创 Python列表(纯干货)

列表 :[] 一组数据 list1,定义:list = [] list = [1,‘a’,3.14] list = [1]2,切片:同tuple str3,改变值:list[0] = 54,操作len()max()min()sum()list.append(“b”) 用于在列表末尾添加新的对象。print(id(list))list = [1,3,3....

2020-02-14 18:21:17 90

原创 Python元组(纯干货)

元组创建新元组 ()元组:tuple1,定义 t = ()空的元组 t = (1,“2”,“a”,3.14)2,是否可以动态改变元素:值不可变3,切片 同str4,操作:print(len(t)) :方法返回对象(字符、列表、元组等)长度或项目个数。print(t.count(1)) :计数print(t.index(1)) :法检测字符串中是否包含子字符串 st...

2020-02-13 14:46:36 107

原创 Python字符串(纯干货)

#字符串1.定义字符串’ ’‘’ ‘’‘’’ ‘’’“”" “”"内置函数操作:len()切片:print(s[0:9])print(s.count(“天”)) 计数次数# print(s1.isalpha()) 是否字母# print(s1.upper().lower()) 大小写# p...

2020-02-11 18:42:22 160

原创 Python循环语句(纯干货)

循环语句for 变量 in range([起始,]终止[,步长]):循环内容嵌套循环起始while 终止表达式:循环体步长如何跳出多重循环?1.写成函数在Python中,函数运行到return这一句就会停止,因此可以利用这一特性,将功能写成函数,终止多重循环,例如def work():for i in range(10):for j in range(10):if i+...

2020-02-09 22:23:12 178

原创 Python标识符(纯干货)

标识符含义:简单地理解,标识符就是一个名字,就好像我们每个人都有属于自己的名字,它的主要作用就是作为变量、函数、类、模块以及其他对象的名称命名规则首先是常用的命名规则1.只能由字母,数字,下划线,构成2.数字不能开头3.大小写敏感 大写和小写的字母有着不同的含义4.不能是关键字import keywordprint(keyword.kwlist)#代码用来呼出所有关键字关键字包...

2020-02-06 19:07:35 1023

原创 Python基础

Python基础#python 中文意思蟒蛇Python发展史1989年,为了打发圣诞节假期,Guido开始写Python语言的编译器。Python这个名字,来自Guido所挚爱的电视剧Monty Python’s Flying Circus。他希望这个新的叫做Python的语言,能符合他的理 想:创造一种C和shell之间,功能全面,易学易用,可拓...

2020-02-05 15:57:47 131

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除