pandas
安奇999
互联网数据分析师一枚
展开
-
pandas案例-提取评价数
从下面文本中提取商品评价数import pandas as pdimport numpy as np li=[[1,'12.3w+条好评'],[2,'1983条好评'],[3,'1条好评'],[4,np.nan]]df=pd.DataFrame(li,columns=['商品id','评价'])提取评价单位,当有’w’时,返回10000,否则返回1### 提取评价单位import numpy as np def my_func(x): num=1.0 if x is n原创 2021-07-06 14:30:27 · 168 阅读 · 0 评论 -
Python使用pymysql从MySQL数据库中读出数据
Python使用pymysql从MySQL数据库中读出数据python3.x已经不支持mysqldb了,支持的是pymysql使用sqlalchemy,出现No module named ‘MySQLdb’错误。import pymysql.cursorsimport pymysqlimport pandas as pd#连接配置信息config = { 'host'原创 2017-07-15 21:07:18 · 16194 阅读 · 0 评论 -
pandas学习03--数据合并之纵向横向
假设有一个10行2列都是1的数据df1=pd.DataFrame(np.ones((10,2)))假设还有一个8行2列都是0的数据df2=pd.DataFrame(np.zeros((8,2)))纵向合并pd.concat([df1,df2])横向合并pd.concat([df1,df2],axis=1),不全是的数据默认NaN原创 2016-08-11 10:16:09 · 6365 阅读 · 0 评论 -
pandas cut函数快速自定义分类
数据如图所示生成未下单间隔列df['未下单间隔']=df.最近下单时间.map(lambda x :\ round((pd.to_datetime('2018-04-08')-pd.to_datetime(x[:10])).total_seconds()/(24*60*60)))df['未下单分类']=pd.cut(df.未下单间隔,bins=[-...原创 2018-04-08 14:52:12 · 4436 阅读 · 0 评论 -
pandas常用函数
常用模块import pandas as pdimport numpy as npastype 转换数据类型 df['实付']=df['实付'].astype('int64')df1['实付']=df['实付'].astype('float')df.dtypes 查看数据列的数据类型apply 对每个元素进行操作,可应用于df map是Series的函数,applymap可用...原创 2018-03-27 18:25:30 · 962 阅读 · 0 评论 -
anaconda 环境管理
查看当前系统的anaconda环境conda info -e新建一个 conda 环境“tensorflow”conda create -n tensorflow pip python=3.5激活环境mac: source activate tensorflow退出环境mac:source deactivate或者直接移到root环境source activate root移除环境conda re...原创 2018-03-27 18:42:55 · 282 阅读 · 0 评论 -
Python手机号码归属地查询
pip install phone #安装phone包import phonephone.Phone().find('00000000000'){'area_code': '0531', 'city': '济南', 'phone': '00000000000', 'phone_type': '联通', 'province': '山东', 'zip_code': '250000'}import ph...原创 2018-03-28 17:07:13 · 2130 阅读 · 0 评论 -
pandas groupby函数 唯一值
def unique_num(x): return len(np.unique(x))df[(df['京东'].isnull()) & (df['首单'].isnull())& (df['券妈妈'].isnull())].groupby('月份')\.agg({'user_id': unique_num, 'order_id': 'count', \ '支付单量'...原创 2018-04-11 15:58:44 · 2352 阅读 · 0 评论 -
pandas groupby 聚合操作
pandas groupby 聚合查看前5条数据df2.head()df2.groupby('name').agg({'title1':'count', '支付未退款单量':'sum', '实付未退款金额':'sum', '利润':'sum...原创 2018-06-13 14:36:08 · 609 阅读 · 0 评论