![](https://img-blog.csdnimg.cn/20210405230357311.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python
基于python语言的数据分析、爬虫等
一只小辣鸡
a hot chicken
展开
-
python3报错:No module named ‘urllib2‘
Python 3.3之后,urllib2改为urllib.responsePython 2.7 代码:import urllib2 response = urllib2.urlopen('http://www.baidu.com/') html = response.read() print html Python 3.3 代码应该为:import urllib.requestr...原创 2018-06-08 18:23:21 · 7664 阅读 · 0 评论 -
Python Pandas 系列Series
Series:带索引的list原创 2018-05-10 17:43:07 · 429 阅读 · 0 评论 -
Python 字符串操作 starswitch() find() re.IGNORECASE replace() join()
检测开头&结尾开头:starswitch()url = 'http://www.python.org'url.starswich('http')>>>True结尾:endswitch()url = 'http://www.python.org'url.endswich('org')>>>True筛选多个结果url = 'http://www.python...原创 2018-05-08 22:00:32 · 1367 阅读 · 0 评论 -
Python 浮点数运算错误问题
浮点数运算错误溢出[in]: a = 1.1 b = 2.2 a + b[out]: 3.3000000000000003解决方法用Python提供的decimal模块,将浮点数先转换为字符串,再进行运算from decimal import Decimala = Decimal('1.1')b = Decimal('2.2')a + b>...原创 2018-05-06 21:50:10 · 4032 阅读 · 0 评论 -
Python数据分析 - 简单分析 数据标准化scale 区间分组cut
简单计算//price*num=sum例如:fome pandas import read_csvdf = read_csv('filepath\\filename.csv')result = df.price*df.numdf['sum'] = result数据标准化 将数据按比例缩放,一般用0-1标准化x*=(x-min)/(max-min) #百分之*100scale =( df.score...原创 2018-06-10 19:00:24 · 5513 阅读 · 0 评论 -
Python数据分析 比较 运算范围 空值 字符匹配 逻辑运算 随机抽样 表格合并 字段合并 字段匹配
常用条件类型比较运算>, <, >=, <=, !=例如:df[df.comments>1000]运算范围between(left,right)例如:df[df.comments.between(100,300)]空值匹配pandas.isnull(column)例如:df[pandas.isnull(df.title)]字符匹配str.contains(patten...原创 2018-06-02 01:50:37 · 306 阅读 · 0 评论 -
Python 文件导入 数据导出 数据去重drop_duplicates 去空值dropna 去空格strip 字段抽取slice 拆分split
导入csv文件from pandas import read_csvdf = read_csv('路径//文件名.csv')或:df = read_csv('路径//文件名.csv', encoding='UTF-8')导入文本文件from pandas import read_table简易方式:df = read_table('路径名//文件名.txt')read_table函数语法:df =...原创 2018-05-25 01:17:16 · 1349 阅读 · 0 评论 -
Python Numpy 等差数列arange 向量化运算 四则 函数 比较 矩阵 最值
生成等差数列numpy.arange(start, end, step)例1:r = range(1,10,2)for i in r: print (i)>>>1 3 5 7 9(range需要for循环输出,不方便,且不能用于小数)生成小数等差数列例2:import numpynumpy.arange(0.1,0.5,0.01)>>>array([0.1...原创 2018-05-24 18:22:12 · 1316 阅读 · 0 评论 -
关于MapReduce的理解
字面翻译:map -> 映射reduce -> 缩减简易作用:对海量数据进行并行计算的一个编程模型。一.Master:负责调度,分配任务给Worker执行二.Worker 1.mapper:执行函数任务 2.Reducer:汇总mapper传来的结果MapReduce大体上分为六个步骤:input,:输入split:拆分,转换为key-value对 ...原创 2018-05-03 00:10:30 · 246 阅读 · 0 评论 -
Python数据分析笔记 文件数据读取
读取文件内容首行path = 'C:\\Users\\etisan\\Desktop\\a.txt'open(path).readline()注:文件路径要用双反斜杠\\,第一个'\'的作用是转义字符读取文件内容某一行records = [line for line in open(path)]records[1]导入Json,读取字典import jsonpath = 'C:\\Users...原创 2018-04-07 00:51:59 · 219 阅读 · 0 评论