python数据分析
文章平均质量分 78
goodlovingz
这个作者很懒,什么都没留下…
展开
-
numpy大全(一直补充)
一.函数(2017-4-16)import numpy as np.ndim :维度 .shape :各维度的尺度 ,例如简单的二维(5x5)显示为[5, 5] .size :元素的个数 10 .dtype :元素的类型 dtype(‘int32’) .itemsize :每个元素的大小,以字节为单位 ,每个元素占4个字节 ndarray:数组的创建 np.aran...原创 2018-08-10 09:54:54 · 884 阅读 · 0 评论 -
python中的re模块
一、简介正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。二、正则表达式中常用的字符含义1、普通字符和11个元字符:普通字符 匹配自身 abc abc . ...转载 2018-08-11 11:01:07 · 272 阅读 · 0 评论 -
numpy补充
1.numpy中的size()函数:size()函数主要是用来统计矩阵元素个数,或矩阵某一维上的元素个数的函数。参数 numpy.size(a, axis=None) a:输入的矩阵 axis:int型的可选参数,指定返回哪一维的元素个数。当没有指定时,返回整个矩阵的元素个数axis的值没有设定,返回矩阵的元素个数 axis = 0,返回该二维矩阵的行数 axis = 1,返回该...原创 2018-08-14 09:53:02 · 360 阅读 · 0 评论 -
Pandas常用函数
count 非 NA 值的数量 describe 针对 Series 或 DF 的列计算汇总统计 min , max 最小值和最大值 argmin , argmax 最小值和最大值的索引位置(整数) idxmin , idxmax 最小值和最大值的索引值 quantile 样本分位数(0 到 1) sum 求和 mean...原创 2018-08-10 10:03:07 · 389 阅读 · 0 评论 -
基础算法题(python)——翻转矩阵后的得分,错误的集合,单词替换
五、翻转矩阵后的得分题目:有一个二维矩阵 A 其中每个元素的值为 0 或 1 。移动是指选择任一行或列,并转换该行或列中的每一个值:将所有 0 都更改为 1,将所有 1 都更改为 0。在做出任意次数的移动后,将该矩阵的每一行都按照二进制数来解释,矩阵的得分就是这些数字的总和。返回尽可能高的分数。示例: 输入:[[0,0,1,1],[1,0,1,0],[1,1,0,0]] ...原创 2018-07-13 20:00:21 · 451 阅读 · 0 评论 -
基础算法题(python)——重新排序得到 2 的幂,旋转链表,分类颜色,根据字符出现频率排序
八、重新排序得到 2 的幂题目:从正整数 N 开始,我们按任何顺序(包括原始顺序)将数字重新排序,注意其前导数字不能为零。如果我们可以通过上述方式得到 2 的幂,返回 true;否则,返回 false。示例 1:输入:1输出:true示例 2:输入:10输出:false示例 3:输入:16输出:true代码:import itertoolsN = ev...原创 2018-07-18 10:36:08 · 490 阅读 · 0 评论 -
基础算法题(python)——根据身高重建队列,森林中的兔子,两数相除,回文素数
一、根据身高重建队列题目:有一群人站队,每人通过一对整数(h, k)来描述,其中h表示人的高度,k表示在此人前面队列中身高不小于此人的总人数。输入:[[7,0], [4,4], [7,1], [5,0], [6,1], [5,2]]输出:[[5,0], [7,0], [5,2], [6,1], [4,4], [7,1]]代码:# -*- coding: utf-8 -*-# 定义身高队列statu...原创 2018-07-10 19:25:51 · 487 阅读 · 0 评论 -
python爬虫——智联招聘(上)
开发环境 win7+,python3.4+ pymysql库,安装:pip3 install pymysql selenium库,火狐浏览器56.0版本,geckodriver.exe,selenium知识点 MySQL5.5数据库,Navicat图形化界面爬取步骤1.分析智联招聘网,获取网页信息 打开“https://www.zhaopin.com/”选择城市“北京”,输入“...原创 2018-05-06 15:04:25 · 1604 阅读 · 0 评论 -
python的pyecharts绘制各种图表详细(代码)
环境:pyecharts库,echarts-countries-pypkg,echarts-china-provinces-pypkg,echarts-china-cities-pypkg 数据:2018年4月16号的全国各地最高最低和天气类型的数据——2018-4-16.json(爬虫爬的)代码:天气数据爬虫代码,图表绘制代码 代码地址:https://github.com/goodloving...原创 2018-04-17 17:52:21 · 150601 阅读 · 29 评论 -
Pandas大全(一直补充)2
二、读取 csv 文件 1、普通方法读取最简单、最直接的就是 open() 打开文件:with open("./marks.csv") as f: for line in f: print line2、Python 中还有一个 csv 的标准库,足可见 csv 文件的使用频繁了。 import csv csv_reader = csv.rea...原创 2018-08-10 09:54:23 · 669 阅读 · 0 评论 -
Pandas大全(一直补充)
一、pandas基本数据结构Pandas 是基于 NumPy 的一个非常好用的库,正如名字一样,人见人爱。之所以如此,就在于不论是读取、处理数据,用它都非常简单。 基本的数据结构Pandas 有两种自己独有的基本数据结构。读者应该注意的是,它固然有着两种数据结构,因为它依然是 Python 的一个库,所以,Python 中有的数据类型在这里依然适用,也同样还可以使用类自己定义数据类...原创 2018-08-10 09:54:41 · 1948 阅读 · 0 评论 -
Pandas大全(一直补充)3
1.python中pandas库里的read_table和read_csv的区别他们的默认切割符号不一样,其他,除了方法名不一样,都一样 read_table默认是'\t'(也就是tab)切割数据集的; read_csv默认是','(也就是逗号)切割数据集的; 2.滤除缺失数据:dropna()函数对于DataFrame,dropna()函数会丢掉所...原创 2018-08-13 19:05:11 · 568 阅读 · 0 评论