python
文章平均质量分 52
sd116460
这个作者很懒,什么都没留下…
展开
-
A/B测试
A/B测试A/B测试是促进业务持续增长的最实用,最有效的方式产生迭代想法->论证迭代想法(A/B测试)->实施迭代想法A/B测试可以解决那些常见的业务问题:产品迭代:改变用户的交互界面来提升用户体验,优化新用户的注册流程来提高转化率,确定产品优惠券的最有价值,增加产品功能来提升用户留存算法优化:通过提高推荐系统算法的准确度来提高用户粘性,通过提高搜索排名算法的准确度来提升结果的点击率,通过提高广告显示算法的精确度来提升广告的点击率市场营销:确定最优的营销内容,确定最优的营销时原创 2021-02-19 15:31:21 · 554 阅读 · 0 评论 -
python链接kafka
python链接kafka,向本地写入数据这是一个简单的demo,学习kafka的一小步,同理可用到向数据库的数据读写,还有数据分析伪流式数据读取,用生产者来读取指定位置的数据,消费者进行数据的处理from kafka import KafkaProducer,KafkaConsumerimport jsonimport datetimeimport time# 生产者 存储json数据producer = KafkaProducer( value_seria原创 2021-01-25 18:05:36 · 300 阅读 · 0 评论 -
python操作clickhouse 删除指定数据
python操作clickhouse删除指定数据def info_del2(i): client = click_client(host='地址', port=端口, user='用户名', password='密码', database='数据库') sql_detail='alter table SS_GOODS_ORDER_ALL delete where order_id='+str(i)+';' try:原创 2020-12-17 11:01:52 · 1063 阅读 · 0 评论 -
python 数组内字符串转数字
row='1,2,3.0,nan'#字符串转数组,并去除特殊符号,去掉.0转为格式上的整数list(row.replace('nan','0').replace('.0','').split(','))['1', '2', '3','0']#将格式上的整数,转换为类型上的整数list(map(int,list(row.replace('nan','0').replace('.0','').split(',')) ))[1, 2, 3]方法:list(map(int,st.原创 2020-09-24 15:07:20 · 4915 阅读 · 0 评论 -
python上传文件至指定服务器
import paramiko#创建ssh对象ssh = paramiko.SSHClient()#ssh.load_host_keys("C:/Users/Administrator/.ssh/known_hosts")#允许连接不在know_hosts文件的主机上ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())filename = ['artist_followby_user.tsv','artist.tsv','acti.原创 2020-09-21 14:46:54 · 4926 阅读 · 2 评论 -
pandas展示所有列
pandas在进行数据展示时,优势因为列数过多,会将中间的列压缩为省略号。添加语句:pd.set_option('display.max_columns', None)可以展示所有数据原创 2020-09-21 14:44:00 · 1602 阅读 · 0 评论 -
python X[;,0],X[:,1:]的含义
X=result[:,1:]表示:x是result中取下标(字段下标)从1到全部的数据列X[:,0]表示;xx是result中取下标(字段下标)为0的数据列原创 2020-09-02 18:31:15 · 1050 阅读 · 0 评论 -
python操作es进行数据的查找,删除
python操作ES的基础都依赖于python的from elasticsearch import Elasticsearch 包from elasticsearch import Elasticsearchimport jsonimport pandas as pdimport rees = Elasticsearch(hosts="xxxxx", port=xxxx)if __name__ == '__main__': query = {'query': {'matc原创 2020-08-19 11:37:24 · 1324 阅读 · 0 评论 -
使用pandas计算分组前十名并排序
result.loc[:,'count_sub']=result['last_week_count']-result['llast_week_count'] print(result.head()) result.sort_values(['artist_third_id','count_sub'],ascending=False,inplace=True) #按照评论增长数排序 result=result.groupby('artist_third_id').head(1...原创 2020-08-10 14:38:32 · 6361 阅读 · 0 评论 -
python数据处理/包含字典的数组
从mongo提取数据的时候,遇到了一类让人有点头疼的数据,数据类型是一个数组,数组内包含的是字典,大致如下:在处理的过程中想了半天办法,也学了不少东西:先说说怎么处理这类数据,再来说我中间用到的几种新的方法,虽然没有起到特别大的作用,但是学到了不少新东西。解决办法算是用了比较暴力的方法:使用mongo的aggregate方法筛选数据,这里的col是我已经创建好了的一个指定mongo的表pipline = [ {'$match': {"$and": [{"crawl_time":原创 2020-08-04 10:38:57 · 2762 阅读 · 1 评论 -
使用python发送邮件
import smtplibfrom email.mime.text import MIMETextfrom email.header import Header# 发件人邮箱账号sender = '发件人'# 收件人 可多人receiver = ['收件人']ccreceiver = ['抄送者']# 标题subject = '标题'smtpserver = ...原创 2019-11-26 18:06:38 · 251 阅读 · 0 评论 -
基于密钥登录的sftp数据传输python脚本
# daily_learn_note#### 介绍日常学习总结####sftp使用密钥进行文件传输import datetimeimport paramiko# 该包需要安装my_key = paramiko.RSAKey.from_private_key_file('密钥存储位置')transport = paramiko.Transport(('地址',端口号))transport.connect(username='账户名',pkey=my_key)s...原创 2020-06-11 10:45:42 · 998 阅读 · 0 评论 -
python 链接ES(elasticsearch)
python链接ES进行数据操作首先需要安装ES相关的python包pip install elasticsearch安装完成后开始进行链接操作:代码如下:from elasticsearch import Elasticsearch# es = Elasticsearch() # 默认连接本地elasticsearch# es = Elasticsearch(['xxx.xx.xx.xx:9200']) # 连接指定9200端口es = Elasticsearch.原创 2020-07-23 10:25:25 · 3923 阅读 · 0 评论 -
python 执行定时脚本
from apscheduler.schedulers.background import BackgroundSchedulerimport osimport timeimport datetimedef task_list_info(): """ :return: """ # 你的脚本存储位置 os.system('python /home/...........')if __name__ == "__main__": sch...原创 2020-07-17 18:18:39 · 1101 阅读 · 0 评论