- 博客(11)
- 收藏
- 关注
原创 Python数据处理简单认识
数据处理的过程:数据收集、数据录入、数据清洗、数据处理、数据集成、数据管理、数据分析、提供数据服务数据收集:通过注册登记、问卷、面试采访获取数据,或者科学家勘测、测量的数据以及实验文档记录,公司报表等都是获取数据的方式. 数据清洗: 数据清洗可以简单分为这几个过程:解析、修正、标准化,合并 解析:将无结构的文本转化为字段和值的有结构的数据 修正:将无效的Unknown或缺失值按照实...
2018-07-05 17:15:31 385
原创 Scrapy框架的原理及简单使用
一.介绍: Scrapy是一个纯Python编写,为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。二.环境搭建: Scrapy的安装:1. scrapy需要安装第三方库文件,lxml和Twisted2. 下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/3.下载好文件之后,在DO...
2018-06-28 18:06:30 1824
转载 Python XML解析
python对XML的解析常见的XML编程接口有DOM和SAX,这两种接口处理XML文件的方式不同,当然使用场合也不同。python有三种方法解析XML,SAX,DOM,以及ElementTree:<?xml version="1.0" encoding="utf-8" ?><Students shelf="金庸程序工程师"> <Student id="01.
2018-06-17 16:39:56 387
转载 Python3的读写文件,os模块,序列化
Python语言读写文件的函数open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)mode的几个参数:r 只能读r+ 可读可写 从顶部开始写,覆盖之前位置的内容 不创建不存在文件rb 读取二进制文件 不创建不存在文件w 写 不创建不存在文件...
2018-06-13 21:33:11 347
转载 Python闭包与装饰器
一.闭包如果一个内嵌函数中引用了外部函数中的变量(非全局变量)。那么该内嵌函数称之为闭包也就是将组成函数的语句和这些语句的执行环境打包在一起时,得到的对象闭包满足的三个条件:1.必须是内嵌函数2.外层函数返回值是内嵌函数3.内嵌函数引用外层函数变量def Funx(x): def Funy(y): return x*y def Funz(z): re...
2018-06-10 19:26:42 264
原创 Python异常、推导特性、迭代器、生成器
一.异常 1.语法: try: 代码块 except 异常类型: 捕获异常后的操作 else: 没有异常发生,进入else finally: 无论是否发生异常,finally总是进入def testException(): try: ...
2018-06-06 18:04:02 237
原创 Python类和对象
Python是一种面向对象语言,有其三大特性,封装,继承,多态一.1.类 具有相同属性和行为特征的对象的集合class Car: name="car" #对象 #初始化方法 def __init__(self,brand=None): self.brand=brand def printCar(self): print(self...
2018-06-04 20:46:48 410 1
原创 Python3函数(一)
1.返回值 当函数返回值为多个时,可以用多个变量来接收,或自动组装为元组def fun(a,b): a,b=11,12 return a,bprint(fun(1,2))2.三个大数据常用的函数 1>map(func, *iterables)自动遍历序列各元素后,执行单个元素的对应操作后返回结果 foo=[2,18,9,22,17,24,8,12,27]foo2=[1...
2018-05-30 19:32:51 384
转载 Python3元组、字典、集合、函数
1.元组 1>介绍,Python序列之一,与列表相似,但元素不可变(不可增删改) 2>声明方法 tup1=(1,2,3); 3>修改 tup1[0]=2 #非法,报错 4>删除del tup1[0] #TypeError: 'tuple' object doesn't support item deletiondel tup1#可以删除整个元...
2018-05-27 12:19:26 464
转载 Python3字符串,列表
1.字符串运算符a="Hello"b="world"c=a+b #拼接字符串 Helloworldprint("h" in a) #返回False 0print("h" not in a) #返回True 1mystr=r"Hello\nWorld" #r代表原本的字符串,转义符失效mystr2=mystr[:] #截取全部字符串注:a=b 地址值不发生改变,a引用b之前的地址a=b...
2018-05-23 18:35:13 605
转载 初识Python3
1.Python介绍 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。2.Python3基本数据类型 Python中无需声明变量,变量名=数值 赋值即可,变量即对象的引用 数据类型分为以下几种: ①Number 数字 数字分为:int长整型,bool,float,complex(复数:4+3j) 注:混合计算时,整型会变成...
2018-05-19 16:34:21 326
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人