python代码收藏
写过的一些重要代码收藏,经常温习。
gulie8
这个作者很懒,什么都没留下…
展开
-
将科学计数法表示的DataFrame数据转换为浮点数
#将科学计数法表示的数据转换为浮点数qddf['业绩(拆分)']=['%.2f' % x for x in qddf['业绩(拆分)'].values]#筛选出指定时间段的数据cjdf.月份=pd.to_datetime(cjdf.月份)cjdf=cjdf[(cjdf.月份>'2021-06-01')]一般有两种方法:1.将df['date']转换为dtype系列datetime64[ns],使用布尔型掩码,然后使用 df.loc[mask].2....原创 2021-08-26 17:01:02 · 4091 阅读 · 0 评论 -
groupby组内排序如取前n名
def sortv(x): return x.sort_values(ascending=False)[:5]tips.groupby(by='sex')['tip'].apply(sortv)原创 2021-08-25 11:51:31 · 502 阅读 · 0 评论 -
代码收藏3
求标准差、均值、中位数等:#求分月分租售的成交周期中位数import numpy as npimport pandas as pddf=pd.read_excel(r'd:\Users\zhanggl21\Desktop\成交数据\ctm成交数据探索(2021年1月-2021年5月).xlsx',\ sheet_name='成交周期中位数')#看各月买卖的成交周期标准差、均值和中位数for y in range(1,6): print('202原创 2021-06-18 17:16:38 · 65 阅读 · 0 评论 -
python数据降维代码
'''…………………………………………python数据降维………………………………START'''#本示例中,将分别使用sklearn的DecisionTreeClassifier来判断变量重要性并选择变量,通过PCA进行维度转换。import numpy as npfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.decomposition import PCA#读取数据文件data=np.loadtxt(r'...原创 2021-06-11 17:36:07 · 339 阅读 · 2 评论 -
代码收藏1
# 查看哪些值缺失nan_all = df.isnull() # 获得所有数据框中的N值print (nan_all) # 打印输出# 查看哪些列缺失nan_col1 = df.isnull().any() # 列出至少有一个元素含有缺失值的列nan_col2 = df.isnull().all() # 列出全部元素含有缺失值的列print (nan_col1) # 打印输出print (nan_col2) # 打印输出# 丢弃缺失值df2 = df.dropna() # 直接丢弃原创 2021-06-08 17:48:33 · 69 阅读 · 0 评论 -
代码收藏2
# 判断及删除重复数据原创 2021-06-09 17:45:34 · 82 阅读 · 0 评论 -
学生上网分析--DBSCAN密度聚类
DBSCAN算法是一种基于密度的聚类算法:DBSCAN是基于一组邻域来描述样本集的紧密程度的,参数(ϵ, MinPts)用来描述邻域的样本分布紧密程度。其中,ϵ描述了某一样本的邻域距离阈值,MinPts描述了某一样本的距离为ϵ的邻域中样本个数的阈值。1.聚类的时候不需要预先指定簇的个数;2.最终的簇的个数不定。DBSCAN算法将数据点分为三类:核心点:在半径Eps内含有超...原创 2019-12-23 18:02:56 · 947 阅读 · 1 评论 -
31省消费水平--聚类分析
数据源样式:代码(自己写的):#读入数据fr=open(r'd:\Users\zhanggl21\Desktop\Python机器学习应用\31省市居民家庭消费水平-city.txt','r+')lst=[]for line in fr: lst.append(line.strip().split(','))citydata=[]cityname=[]f...原创 2019-12-23 16:07:00 · 4221 阅读 · 1 评论 -
直聊聊天记录-客户留电探究python代码(运用正则表达式)
# -*- coding: utf-8 -*-"""Created on Thu Dec 5 17:50:21 2019@author: zhanggl21"""'''直聊聊天记录-客户留电探究'''#导入数据import pandas as pdzldf=pd.read_excel(r'd:\Users\zhanggl21\Desktop\2019年11月直聊总表.x...原创 2019-12-05 17:50:01 · 234 阅读 · 2 评论 -
月度成交分析报告-python代码3
#画一手分销的单数与业绩#增加'总单数'和'总业绩两列'fx_df['总单数']=fx_df.一手分销ctm单数+fx_df.一手分销ptm单数fx_df['总业绩']=fx_df.一手分销ctm业绩+fx_df.一手分销ptm业绩import matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font....原创 2019-12-02 15:38:58 · 398 阅读 · 0 评论 -
月度成交分析报告-python代码2
#看哪个网站对各大战区贡献总业绩最多qd_pdf_eachnet=qd_pdf_eachnet.rename(columns={'区董':'成交区董'})qd_df_eachnet=pd.concat([qd_cdf_eachnet,qd_pdf_eachnet],join='outer',\ ignore_index=True).group...原创 2019-12-02 15:38:04 · 202 阅读 · 0 评论 -
月度成交分析报告-python代码1
"""Created on Thu Mar 14 16:33:36 2019@author: zhanggl21"""'''此版较前一版更新:图表配色参数修改''''''################Report##########################....''''''##########一.网络成交核心数据''''''...原创 2019-12-02 15:37:18 · 306 阅读 · 0 评论 -
支付宝租房来电成交总结
# -*- coding: utf-8 -*-"""Created on Tue Apr 23 14:38:26 2019@author: zhanggl21"""import pandas as pdaldf=pd.read_excel(r'E:\暂存\支付宝租房\支付宝租房所有来电成交F201809.xlsx',\ sheet_na...原创 2019-10-29 10:01:26 · 127 阅读 · 0 评论 -
虚拟号码来电数据统计-python脚本
# -*- coding: utf-8 -*-"""Created on Fri Mar 29 10:36:39 2019@author: zhanggl21"""'''运行此脚本前,1.先把导出的excel表格式整理好.2.再把字段“通话时长 秒”修改为“通话时长”3.并放在桌面,命名为“虚拟号码通话记录”4.另,'所有号码数'要不定时更新。'''#将数据表导入...原创 2019-10-29 10:00:11 · 1178 阅读 · 0 评论 -
客户分配系统V20190910
# -*- coding: utf-8 -*-"""Created on Wed Jun 19 15:43:37 2019@author: zhanggl21"""'''************较前一版,主要改动:************'''#由只匹配用户访问或电话或直聊的第一个楼盘,变为匹配所有楼盘的小战区''''''--------------...原创 2019-10-29 09:59:25 · 240 阅读 · 0 评论 -
登录用户行为量化(用户id提取)
# -*- coding: utf-8 -*-"""Created on Thu Mar 7 10:40:18 2019@author: zhanggl21"""#登录用户行为数据#1.将数据读入内存import pandas as pd#df1=pd.read_excel(r'E:\暂存\登录用户量化表20190114\2018年11月-登录用户行为报表.xlsx')...原创 2019-10-29 09:27:19 · 335 阅读 · 0 评论 -
python连接数据库取数
# -*- coding: utf-8 -*-"""Created on Thu Dec 27 13:45:23 2018@author: zhanggl21"""'''Sql中的游标是干嘛的?在数据库中,游标提供了一种对从表中检索出的数据进行操作的灵活手段。就本质而言,游标实际上是一种能从包括多条数据记录的结果集中每次提取一条记录的机制。游标总是与一条SQL 选...原创 2019-10-29 09:26:30 · 475 阅读 · 0 评论 -
运用正则表达式提取DataFrame某列的手机号
import rephone_regex=re.compile(r'1\d{10}')import pandas as pddf=pd.read_excel(r'd:\Users\zhanggl21\Desktop\6月直聊.xlsx')#定义一个空的列表alst=[]#循环并把匹配到的值添加到列表(注册判断空值)for x in df.聊天记录: if phone...原创 2019-07-15 17:48:24 · 1812 阅读 · 0 评论