Python
一克拉的小蚂蚁
这个作者很懒,什么都没留下…
展开
-
Python—调用GrowingIO平台接口下载CSV数据
import requestsimport gzipimport osos.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'requests.packages.urllib3.disable_warnings()token = "Authorization"ai = "项目ID" #项目IDminutes = 5 #下载链接过期时间(分钟)export_type = "day" #导出任务类型,系统目前支持小时.原创 2020-07-20 10:22:42 · 636 阅读 · 3 评论 -
Python——Python3使用MySQLdb驱动
fatal error C1083: Cannot open include file: 'config-win.h': No such file or directory通过python访问操作MySQL数据库,需要下载MySQLdb驱动。(1)对于python2.x版本,可以直接安装MySQLdb驱动;或者下载MySQL-Pthon,其中包含MySQLdb驱动。(2)对于py...原创 2018-04-14 15:47:41 · 1159 阅读 · 0 评论 -
Python——利用Python发送邮件(此处示例QQ邮箱)
# -*- coding: utf-8 -*-"""Created on Tue Feb 19 16:02:17 2019@author: liuxiaohuan"""import smtplibfrom email.mime.multipart import MIMEMultipartfrom email.mime.text import MIMETextfrom emai...原创 2019-02-20 10:43:08 · 550 阅读 · 0 评论 -
Python——jieba分词并统计词频
1、连接数据库:本文数据库为MySql数据库,利用Python的MySqldb连接;2、读取数据表evalute_info表中的评论内容;3、利用jieba对评论内容进行分词,并统计词频;4、将结果保存为csv文件。注:两个关键点: 分词:jieba.cut();词频:Counter(data) (利用collections包的Counter进行词频统计)# ...原创 2019-04-26 13:07:02 · 8288 阅读 · 0 评论 -
Python——制作中文词云
from os import pathfrom wordcloud import WordCloudwc = WordCloud( background_color="white", #背景颜色 max_words=200, #显示最大词数 font_path='./fonts/simhei.ttf' )cloud_text = open(path.joi...原创 2019-04-28 13:43:48 · 1124 阅读 · 0 评论 -
Python——TF-IDF模型
# -*- coding: utf-8 -*-import MySQLdbimport pandas as pd import jiebafrom sklearn.feature_extraction.text import TfidfTransformer from sklearn.feature_extraction.text import CountVectorizer ...原创 2019-04-28 13:55:41 · 1328 阅读 · 0 评论 -
Python——电商用户购买系列相关性
背景:假设电商平台会员300万,商品按照系列划分有30个系列,本次分析的目的:分析用户购买系列间的相关性。# -*- coding: utf-8 -*-"""Created on Mon May 13 13:40:14 2019@author: liuxiaohuan"""import osimport cx_Oracleimport pandas.io.sql as s...原创 2019-05-17 17:52:47 · 774 阅读 · 0 评论 -
Python——解决工作中的小问题
问题描述:业务系统的会员信息表进入到数仓中,存在数据缺失,其造成这一问题的原因是后台会手动处理一些数据(卸数等ETL流程不存在问题),造成卸数时取不到这些数据,经过考虑,决定用Python解决这一问题。以下代码中设计到的一些比较有用的函数及问题:1、比较两个list,取出一个list不存在于另一个list中的值final=set(data_userid).difference(set(...原创 2019-06-17 16:03:11 · 3529 阅读 · 0 评论