python
python学习笔记
向日葵不嗑瓜子
这个作者很懒,什么都没留下…
展开
-
透视图与交叉表
import pandas as pdimport numpy as npimport osos.chdir(r'C:\Users\wangyaqian\Desktop\Excel学习包')df = pd.read_excel('test.xlsx',header = 0,sheet_name = 0,\ encoding = 'utf-8')...原创 2020-05-04 11:38:31 · 174 阅读 · 0 评论 -
数据整合、层次化索引、分组聚合
1.数据整合import pandas as pddf1 = pd.DataFrame({'id':[1,2,3,4,5],'name':['张三','李四','王五','丁一','赵二'],'age':[27,25,16,34,16],'gender':['男','女','女','男','男']})df2 = pd.DataFrame({'Id':[1,2,2,4,5,6,7],'kem...原创 2020-04-27 11:29:57 · 227 阅读 · 0 评论 -
数据分析常用库之Pandas之数据库连接和条件查询与增删改查
import pandas as pdimport pymysql#建立连接db = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='1234', db='ncslab', charset='utf8')sql = 'select id from test_rigs'df1 = pd.read_sql(...原创 2020-04-26 18:03:28 · 451 阅读 · 0 评论 -
数据分析常用库之Pandas之数据存取与数据筛选
基本概念1.pandas内置10多种数据源读取函数,常见的CSV,EXCEL2.pandas读取出来的数据直接是数据框格式3.可以快速地将数据保存为CSV或者EXCEL格式4.参数较多,多数时候用默认参数,可以自行设置5.读取CSV时,常用编码格式为utf-8,gbk,gbk2312等utf-8,gbk区别数据读取1.CSVimport osimport pandas as p...原创 2020-04-24 12:10:51 · 218 阅读 · 0 评论 -
Numpy随机数生成函数/统计函数
1.随机数函数np.random.random()#产生0-1之间的随机浮点数np.random.seed(1234)np.random.random(3,4)#产生总值固定的随机数np.random.rand()#均匀分布随机数,即每个数的概率相同np.random.randint(0,100,size=())#给定范围随机整数,size规定类型,例如元组,列表等np.rand...原创 2020-04-23 12:29:16 · 201 阅读 · 0 评论 -
Numpy文件读写与字符串操作
1.文件读取import numpy as npdata = np.genfromtxt(r'D:\电器录播\ProcessingData\00EX_CFJ_12_01.csv', delimiter=',')#delimiter 分隔符参数#skip_header = 1跳过表头,即第0行,从第一行开始读#print(data)np.savetxt(r'路径+格式', data, d...原创 2020-04-18 11:10:18 · 1136 阅读 · 0 评论 -
数据分析常用库之numpy之数组的uFanc广播机制
1.特点(1)uFanc通用函数:能够对array中的左右元素进行操作的函数。(2)Broadcasting指对不同形状的array之间执行算数运算的方式。(3)不同形状的数组运算时,Numpy则会执行广播机制(4)Numpy能够运用向量化运算处理整个数组,所以速度会比较快。广播运算机制1.行数补齐:2.列数补齐:注意,执行 broadcast 的前提在于,两个 ndarray 执...原创 2020-04-18 09:17:14 · 214 阅读 · 0 评论 -
数据分析笔试卷-meitua
一、广告是互联网企业重要的变现模式,在美团的广告业务中,商家会和美团的销售签订不同类型的广告合同(比如,按点击收费的广告cpc、按曝光收费的广告cpm、按时长收费的广告cpt)。美团会为商家创建相关的广告内容素材创意(比如,门店图片、活动图片、促销文字等),并通过美团的广告引擎,根据用户访问的行为特征,基于算法策略将商家的广告内容投放到美团的app或者外部合作伙伴(比如如:腾讯,头条)的app不同...原创 2020-04-15 14:11:15 · 319 阅读 · 0 评论 -
数据分析常用库之Matplotlib
Matplotlib原创 2020-04-09 15:35:30 · 89 阅读 · 0 评论 -
数据分析常用库之Pandas之数据结构
1.pandas1、特点:(1)专门用于数据处理和分析,拥有各种复杂函数;(2)支持类似于SQL数据处理,支持时间序列分析等;2、基础函数(1)Series类型:由一组数据和与之相对应的数据索引组成。数据可以是标量,列表和字典,数据索引默认[0, 1, 2…],也可以使用index参数指定。示例:列表:import pandas as pds = pd.Series([1, 2...原创 2020-04-09 15:22:23 · 153 阅读 · 0 评论 -
数据分析常用函数
1.lambda匿名函数lambda:是指一类无需定义标识符(函数名)的函数或子程序。格式:冒号前是参数,可以有多个,用逗号隔开,冒号右边的为表达式。其实lambda返回值是一个函数的地址,也就是函数对象。说明:lambda函数并不能提高程序效率,只是为了是代码更加简洁。##单个参数g = lambda x: x**2print(g(2))#4f1 = lambda x: 'A'i...原创 2020-04-09 11:35:12 · 1290 阅读 · 0 评论 -
字符串处理
链接: link.原创 2020-04-08 10:37:51 · 59 阅读 · 0 评论 -
json文件解析及常见问题
json文件读取与解析函数解释json.dumps将 Python 对象编码成 JSON 字符串json.loads将已编码的 JSON 字符串解码为 Python 对象json.dump打开文件并将 Python 对象编码成 JSON 字符串json.loads将 Python 对象编码成 JSON 字符串并存储import simplejs...原创 2020-04-07 16:35:19 · 355 阅读 · 0 评论 -
数据分析之函数编写
内置函数1.枚举enumerate()ab = ['one', 'two', 'three']for i, j in enumerate(ab): print(i, j) ####0 one1 two2 three2.组合zip()list1 = ['a', 'b', 'c', 'd']list2 = [1, 2, 3, 4]print(list(zip(list1...原创 2020-04-07 11:38:17 · 235 阅读 · 0 评论 -
列表/字典/元组/集合
列表添加元素1.append()增加单个元素到列表末尾;只接受一个参数,参数可以是任何数据类型,被追加的元素在List中保持着原结构类型。此元素如果是一个list,那么这个list将作为一个整体进行追加。2.extend()将一个列表中每个元素分别添加到另一个列表中;只接受一个参数。3.insert()将一个元素插入到列表中,但其参数有两个insert(n,”x”),第一个参数是索引点,即...原创 2020-04-05 10:38:22 · 134 阅读 · 0 评论 -
列表转字典/sys.stdout/sys.stdin
i = ['a', 'b']l = [1, 2]print(dict(zip(i, l)))原创 2020-03-27 18:38:53 · 86 阅读 · 0 评论 -
数据分析常用库之numpy之数组基础
numpy库作用:矩阵和数组运算导入from numpy import *;#导入numpy的库函数import numpy as np; #这个方式使用numpy的函数时,需要以np.开头。说明mat()函数和array()函数的区别:Numpy函数库中存在两种不同的数据类型:矩阵matrix和数组array,都可以用于处理行列表示的数字元素,但类型不同,其中Numpy函数库中的m...原创 2020-04-09 19:14:19 · 195 阅读 · 0 评论 -
输入/字符串格式化方法/ 数据截断/字符串翻转/reverse()/sort()/s.join()/`reduce()/
输入1. input和raw_input的区别raw_input:将所有输入作为字符串看待,不管用户输入什么类型的都会转变成字符串。raw的含义就是生的;未加工的。当希望通过raw_input获取一个整型或者浮点数时,必须在生成后对其使用int或float进行转换。input():当输入一个字符串的时候必须使用引号将其括起来,否则他将会引发一个SyntaxError的问题。从上述说明中,...原创 2020-03-27 18:41:58 · 366 阅读 · 0 评论