![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据化运营
小天资源
专注于各种资源、教程,免费分享
展开
-
案例-基于RFM的精细化用户管理
# 导入库import time # 时间库import numpy as np # numpy库import pandas as pd # pandas库import pymysql # mysql连接库from pyecharts import Bar3D # 3D柱形图from sklearn.ensemble import RandomForestClassifi...原创 2020-03-15 08:54:08 · 292 阅读 · 0 评论 -
案例-基于多项式贝叶斯的增量学习的文本分类
# 说明# - Python版本:64位 3.7# - 依赖库:re、tarfile、os、numpy、bs4、sklearn# - 程序输入:article.txt、news_data.tar.gz# - 程序输出:打印输出新的内容所属的主题信息# 程序# 导入库import osimport reimport tarfileimport numpy as np...原创 2020-03-15 08:53:48 · 405 阅读 · 0 评论 -
案例-基于潜在狄利克雷分配(LDA)的内容主题挖掘
# 一、案例-基于潜在狄利克雷分配(LDA)的内容主题挖掘# 说明# - Python版本:64位 3.7# - 依赖库:tarfile、os、jieba、gensim、bs4# - 程序输入:article.txt、news_data.tar.gz# - 程序输出:打印输出18个主题及新文本的预测主题归属# 程序# 导入库import osimport tarfile...原创 2020-03-15 08:53:11 · 902 阅读 · 2 评论 -
案例-基于自动K值的KMeans广告效果聚类分析
# 二、案例-基于自动K值的KMeans广告效果聚类分析# 说明# - Python版本:64位 3.7# - 依赖库:matplotlib、numpy、pandas、sklearn# - 程序输入:ad_performance.txt# - 程序输出:打印输出不同聚类类别的信息# 程序# 导入库import matplotlib.pyplot as plt # 图形库...原创 2020-03-15 08:52:33 · 1234 阅读 · 0 评论 -
案例-基于自动节点树的数据异常原因下探分析
# - 依赖库:datetime、numpy、pandas、graphviz# - 程序输入:advertising_data.csv# - 程序输出:打印输出并保存节点树图change_analysis_tree.png# 程序# 导入库import datetimeimport numpy as npimport pandas as pdfrom graphviz im...原创 2020-03-15 08:51:53 · 234 阅读 · 0 评论 -
案例-基于集成算法AdaBoost、GradientBoosting、RandomForest和Bagging的投票组合模型的异常检测
# - 依赖库:numpy、pandas、sklearn、imblearn# - 程序输入:abnormal_orders.txt# - 程序输出:预测数据直接打印输出## 程序# 导入库import numpy as npimport pandas as pd # pandas库from imblearn.over_sampling import SMOTE # 过抽样处...原创 2020-03-15 08:51:17 · 328 阅读 · 0 评论 -
案例-基于Gradient Boosting的自动超参数优化的销售预测
# 导入库import matplotlib.pyplot as plt # 导入图形展示库import numpy as np # 导入numpy库import pandas as pd # 导入pandas库from sklearn.ensemble import GradientBoostingRegressor # 集成方法回归库from sklearn.metrics...原创 2020-03-15 08:50:45 · 816 阅读 · 0 评论 -
案例-基于嵌套Pipeline和FeatureUnion复合数据工作流的营销响应预测
# 导入库import timeimport pandas as pdfrom imblearn.over_sampling import SMOTE # 过抽样处理库SMOTEfrom sklearn.discriminant_analysis import LinearDiscriminantAnalysisfrom sklearn.ensemble import Random...原创 2020-03-15 08:50:12 · 217 阅读 · 0 评论 -
文本聚类
# 导入库import numpy as npimport pandas as pdfrom sklearn.feature_extraction.text import TfidfVectorizer # 基于TF-IDF的词频转向量库from sklearn.cluster import KMeansimport jieba.posseg as pseg# 中文分词def ...原创 2020-03-15 08:49:43 · 186 阅读 · 0 评论 -
词频统计
# 导入库import re # 正则表达式库import collections # 词频统计库import numpy as np # numpy库import jieba # 结巴分词import wordcloud # 词云展示库from PIL import Image # 图像处理库import matplotlib.pyplot as plt # 图像展示...原创 2020-03-15 08:49:03 · 130 阅读 · 0 评论 -
异常检测分析
# 导入库import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import OrdinalEncoder # 标准化库from sklearn.ensemble import IsolationForestfrom mpl_toolkits.mplot3d import Axes3D...原创 2020-03-15 08:44:56 · 271 阅读 · 0 评论 -
分类分析-案例:用户流失预测分析与应用
# 导入库import pandas as pdfrom sklearn.model_selection import train_test_split # 数据分区库import xgboost as xgbfrom sklearn.metrics import accuracy_score, auc, confusion_matrix, f1_score, \ precisi...原创 2020-03-15 08:44:24 · 385 阅读 · 0 评论 -
回归分析-案例:大型促销活动前的销售预测
# 导入库import pandas as pdimport numpy as npfrom sklearn.linear_model import BayesianRidge, ElasticNet # 批量导入要实现的回归算法from sklearn.svm import SVR # SVM中的回归算法from xgb import XGBRegressorfrom sklea...原创 2020-03-14 15:25:43 · 1455 阅读 · 1 评论 -
聚类分析-案例:客户特征的聚类与探索性分析
import matplotlib.pyplot as plt # 图形库import numpy as np# 导入库import pandas as pd # panda库from sklearn.cluster import KMeans # 导入sklearn聚类模块from sklearn.metrics import silhouette_score, calinski...原创 2020-03-14 12:33:09 · 526 阅读 · 0 评论 -
Python---数据预处理三
11.网页数据解析# 导入库import requests # 用于发出HTML请求from bs4 import BeautifulSoup # 用于HTML格式化处理import pandas as pd # 格式化数据class WebParse: # 初始化对象 def __init__(self, headers): self.head...原创 2020-03-14 10:25:21 · 250 阅读 · 0 评论 -
Python---数据预处理二
3.7 解决运营数据的共线性问题# 导入相关库import numpy as npfrom sklearn.linear_model import Ridgefrom sklearn.decomposition import PCAfrom sklearn.linear_model import LinearRegression# 读取数据data = np.loadtxt('da...原创 2020-03-14 10:21:08 · 156 阅读 · 0 评论 -
Python---数据预处理一
1.缺失值处理import pandas as pd # 导入pandas库import numpy as np # 导入numpy库from sklearn.preprocessing import Imputer # 导入sklearn.preprocessing中的Imputer库# 生成缺失数据df = pd.DataFrame(np.random.randn(6, 4...原创 2020-03-14 10:17:02 · 317 阅读 · 0 评论 -
Python数据化运营之读取数据一
1.从文本文件读取运营数据1.1使用read、readline、readlines读取数据file_name = 'text.txt'file_object = open(file_name)read_data = file_object.read()print(read_data)file_object = open(file_name)readline_data = file...原创 2020-03-14 09:44:45 · 632 阅读 · 0 评论 -
Python数据化运营之读取数据二
5.从API获取运营数据之获取并解析json数据(其中ak为自己在百度地图中自己创建的ak)import requests # 导入库add = '北京市中关村软件园' # 定义地址ak = '' # 创建访问应用时获得的AKurl = 'http://api.map.baidu.com/geocoder/v2/?address=%s&output=json&ak=...原创 2020-03-14 09:55:03 · 182 阅读 · 0 评论