Python
云飞扬°
这个作者很懒,什么都没留下…
展开
-
python把一个列表按指定数目分成多个列表
python把一个列表按指定数目分成多个列表比如[1,2,3,4,5,6,7,8,9,10]分成[1,2,3][4,5,6][7,8,9][10]def list_of_groups(init_list, childern_list_len): list_of_groups = zip(*(iter(init_list),) *childern_list_len) end_list = [list(i) for i in list_of_groups] count = le原创 2021-03-22 14:08:21 · 4328 阅读 · 0 评论 -
python绘图中,坐标轴负号不能正常显示
添加2行代码import matplotlibmatplotlib.rcParams['axes.unicode_minus']=False原创 2020-10-30 10:16:10 · 8238 阅读 · 6 评论 -
数据预处理:几个常用函数
1-groupby 分组统计(与统计函数连用才有意义)# 分组import pandas as pddata = pd.read_excel('../data/pivot_table_demo.xlsx') # 读取数据print(data.head())输出结果:(展示文件中的数据) 学习中心 招生批次 院校名称 层次 ... ...原创 2019-08-21 16:41:57 · 902 阅读 · 0 评论 -
数据预处理:缺失值的处理
缺失值标志:NaN(no a number)缺失值的处理:1-删除dropna 2-填充fillna1-删除from pandas import Seriesimport numpy as npstrSer = Series(['a', 'b', np.nan, 'd', 'e'])print(strSer)输出结果:0 a1 b2 N...原创 2019-08-21 17:47:04 · 762 阅读 · 0 评论 -
数据预处理:异常值及数据标准化
1-异常值的处理--缺失化import pandas as pdimport numpy as npSegData = pd.read_csv('../data/SegData.csv')print(SegData.head())输出结果: age gender income house store_exp ... Q7 Q8 Q9 Q10 ...原创 2019-08-21 21:20:47 · 2090 阅读 · 0 评论 -
客户价值分析:RFM聚类分析原理
一、RFM模型在用户运营过程中,通常需要根据用户的属性对用户进行归类,以便于在转化过程中获得更大的收益。用户有很多属性,究竟选择哪些属性进行分析呢?根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了客户分类最好的指标:R-最近一次消费距当前的时长(Recency)F-消费频率(Frequency)M-消费金额(Monetary)...原创 2019-08-22 08:39:16 · 5405 阅读 · 0 评论 -
案例:互联网金融行业客户价值分析
import pandas as pdfrom datetime import datetimefrom math import ceilfrom pandas import DataFramefrom sklearn.cluster import KMeans# 数据读取data=pd.read_excel('../data/RFM聚类分析【样本数据】.xlsx',index_c...原创 2019-08-22 21:12:32 · 925 阅读 · 1 评论 -
python数组的反转
import numpy as nparr = np.arange(10)# 反转前print(arr)输出结果:[0 1 2 3 4 5 6 7 8 9]# 反转后arr2 = arr[::-1]print(arr2)输出结果:[9 8 7 6 5 4 3 2 1 0]原创 2019-09-04 15:24:15 · 3873 阅读 · 0 评论 -
python中字符串中值的逐个读取
功能:将字符串的内容逐个录入到列表中words = []for word in str: words +=word print('words = ',words)原创 2019-09-11 14:51:30 · 5835 阅读 · 0 评论 -
python中enumerate()的用法
在同时需要index和value值的时候可以使用 enumerate。下列分别将字符串,数组,列表与字典遍历序列中的元素以及它们的下标:一、字符串for i, j in enumerate("abcde"): print(i, j)输出结果:0 a1 b2 c3 d4 e二、数组import numpy as nparr = np.array([1, ...原创 2019-09-11 16:47:03 · 433 阅读 · 0 评论 -
python中lambda函数用法
lambda匿名函数的格式:冒号前是参数,可以有多个,用逗号隔开,冒号右边的为表达式。例1:传入一个参数的lambda函数a=lambda x:x*xprint(a(3)) 例2:传入多个参数的lambda函数def sum(x,y): return x+y用lambda来实现:p = lambda x,y:x+yprint(p(4,6))...原创 2019-09-17 09:25:21 · 540 阅读 · 0 评论 -
数据预处理:数据集的合并
1-merge# mergeimport pandas as pddf1 = pd.DataFrame({'key': ['a', 'b', 'c'], 'data1': range(3)})print(df1)输出结果: key data10 a 01 b 12 c 2df2 = pd.DataFrame({'key...原创 2019-08-21 15:05:57 · 2348 阅读 · 0 评论 -
数据探索:数据透视表pivot_table
import pandas as pd# 读取数据data = pd.read_excel('../data/pivot_table_demo.xlsx')print(data.describe()) # 仅展示的是数字字段的print(data.describe(include='all').T) # 展示所有数据透视表-pivot_table1-求各学习中心已缴纳学费...原创 2019-08-21 11:03:50 · 1078 阅读 · 1 评论 -
Python数据可视化--matplotlib基础用法
matplotlib是Python的一个优秀的数据可视化库,能够绘制常用的数据分析图表,还能够绘制三维图像。安装:在cmd窗口中输入pip install matplotlib官方文档:https://matplotlib.org/tutorisals/index.html基础用法:1-通过plt.plot快速绘图import matplotlib.pyplot as ...原创 2019-08-05 18:56:11 · 1115 阅读 · 1 评论 -
Pandas知识点总结
Pandas基于Numpy构建Pandas最初被作为金融数据分析而开发出来,因而Pandas为时间序列分析提供了很好的支持安装:cmd窗口中输入pip install pandas使用时,要先导入import pandas as pd1.Pandas中的数据结构1-1.Series----序列from pandas import Series# 1-创建...原创 2019-07-31 11:39:32 · 636 阅读 · 0 评论 -
Python操作csv和excel文件
数据接口1.csv文件的读取和写入# 1-读取csv文件# 第一种方法(默认分隔符为逗号)df = pd.read_csv('./data/BankData.csv')print(df)输出结果:(部分) 分行编号 不良贷款(亿元) 各项贷款余额 本年累计应收贷款(亿元) 贷款项目个数 本年固定资产投资额(亿元)0 1 0.9 ...原创 2019-07-31 20:57:35 · 1481 阅读 · 0 评论 -
Python操作SQLite数据库
SQLite---python内置sqlite3数据库 python操作数据库的流程开始-->创建connection-->获取cursor-->执行SQL语句,处理数据结果-->关闭cursor-->关闭connection-->结束SQLite---python内置sqlite3数据库# 连接到SQLite数据库(数据库文件是1.db...原创 2019-08-02 11:07:49 · 483 阅读 · 0 评论 -
Python数据可视化--matplotlib常用图表绘制
常用图表绘制1.折线图import matplotlib.pyplot as pltimport pandas as pd# 数据读入df = pd.read_csv('../data/data.csv', index_col='年份')# 获取'人均GDP(元)'这一列的值y = df['人均GDP(元)'].values# 获取索引列的值(年份)x = df.in...原创 2019-08-06 10:53:49 · 1115 阅读 · 0 评论 -
Python数据可视化--Pandas中的绘图函数
Series和DataFrame都有一个用于生成各类图表的plot方法。默认情况下,他们所生成的是线型图1.折线图import pandas as pdimport matplotlib.pyplot as plt# 指定默认字体(防止中文出现乱码)from pylab import mplmpl.rcParams['font.sans-serif'] = ['FangSong...原创 2019-08-06 15:53:54 · 2144 阅读 · 0 评论 -
Python操作MySQL数据库
MySQL---安装PyMySQL---在cmd窗口中pip install pymysqlpython操作数据库的流程开始-->创建connection-->获取cursor-->执行SQL语句,处理数据结果-->关闭cursor-->关闭connection-->结束import pymysql# 连创建connectioon,连接到本地...原创 2019-08-02 15:16:08 · 308 阅读 · 2 评论 -
数据探索:常用统计量分析
一、集中趋势的度量import pandas as pdfrom pandas import Series# 数据读取df1 = pd.read_csv('../data/data.csv', index_col='年份')print(df1.head())# 获取数据个数print(len(df1))# 或者print(df1.index.size)# 均值m =...原创 2019-08-19 18:01:30 · 666 阅读 · 0 评论 -
数据探索:相关性分析
# 数据读取import pandas as pddf=pd.read_excel('../data/regression.xlsx',index_col='分行编号')# 设置字体from pylab import mplmpl.rcParams['font.sans-serif']=['FangSong']# ---散点图---import matplotlib....原创 2019-08-21 09:47:29 · 1259 阅读 · 0 评论 -
Numpy知识点总结
1.介绍及安装Numpy是Numerical Python的简称。NumPy系统是Python的一种开源的数值计算框架。这种工具可用来存储和处理大型矩阵,相当于将Python变成一种免费的更强大的MatLab系统。安装:cmd窗口中输入pip install numpy官方文档:https://docs.scipy.org/doc/numpy/user/quickstart...原创 2019-07-29 18:28:36 · 519 阅读 · 0 评论