- 博客(57)
- 资源 (2)
- 收藏
- 关注
原创 <十四五规划以及2035年远景目标建议> 简单提炼
一:全面小康,开启全面建设社会主义现代化--开篇奠定这个建议的主基调问题:发展不平衡,重点领域改革艰巨,创新不适应高质量发展,农业基础不稳,城乡收入差距大,【生态环保、民生保障短板、社会治理】还有弱项优势:治理效率提高,经济长期向好,物质基础丰富,市场空间广、韧性强,社会大局稳建议:认识新矛盾和新挑战,增强机遇和风险意识,认识和把握发展规律,危机中孕育着先机,善于求变方向:新型工业化,信息化,城镇化,农业现代化,文化,教育,人才,体育,健康强国二:创新驱动发展强化国家战略科技力量——
2020-11-16 16:08:04 2330 1
转载 实时数仓技术
本文链接:https://blog.csdn.net/DiDi_Tech/article/details/108250719收起桔妹导读:随着滴滴业务的高速发展,业务对于数据时效性的需求越来越高,而伴随着实时技术的不断发展和成熟,滴滴也对实时建设做了大量的尝试和实践。本文主要以顺风车这个业务为引子,从引擎侧、平台侧和业务侧各个不同方面,来阐述滴滴所做的工作,分享在建设过程中的经验。1.实时数仓建设目的随着互联网的发展进入下半场,数据的时效性对企业的精细化运营越来越重要,商场.
2020-08-31 13:59:18 1554
原创 画像简述
画像(标签)定义:用户》》》全域画像:整个公司级别的画像数据,一般基础字段多而广,包含公司所有的业务数据,交叉集合数据等等业务画像:某个业务模块/产品的画像数据,针对性强,可以和全域画像做对比,找差异点,提升优化运营手段产品》》》产品画像:产品的各项特征,使用场景,功能,渠道等等,主要可以用于和用户画像做交叉推荐构建画像数据收集:有各种途径,注册数据,埋点的行为数据,消费数据,内容交互数据等维度拆解:根据需求先定义大类别的维度标签,常见例如:人口属性——基本人
2020-07-13 17:06:24 658 1
原创 用户分析框架(自用)
线下用户整体分析(整体基于月频)目标:用户增长口径:有过消费算活跃获客月新增绑卡用户的趋势其中线下消费用户多少,占比总用户多少;新增的流失率;消费是否有参与活动,占比如何。活动拉新率,活动拉新的补贴曲线拐点获客/流失比,这个决定整个用户生态是向好还是变差的重要指标留存/流失月留存用户量,趋势;留存用户中参与活动占比(活动可以设置补贴门槛分级显示,明确留存和补贴金额的关联度)留存用户特征(基础属性)中小微和大KA的商户对应用户的留存比,可以差异化运营和成本投
2020-06-17 11:24:55 725
原创 python|LightGBM模型
# -*- coding: utf-8 -*-"""Created on Fri Jun 12 16:20:17 2020@author: weiping"""import xgboost as xgbimport lightgbm as lgb from sklearn.model_selection import train_test_splitfrom sklearn.metrics import *from sklearn.datasets import load_iri.
2020-06-15 15:36:49 4107
原创 获取代理IP
#获取代理IPfrom bs4 import BeautifulSoupimport requestsimport randomdef get_ip_list(url, headers): web_data = requests.get(url, headers=headers) soup = BeautifulSoup(web_data.text, 'lxml') ips = soup.find_all('tr') ip_list = [] for i i.
2020-05-21 18:30:09 292
原创 python 经纬度计算相关
1,高德接口返回地址经纬度import requestsdef getcode(site): parameters = { 'address' : site, 'key': '******高德平台申请******'} base = 'http://restapi.amap.com/v3/geocode/geo' response = requests.get(base, parameters) info_site = response.json() lng
2020-05-21 18:23:16 839
原创 python爬虫+图像识别(接口调用)
# -*- coding: utf-8 -*-"""Created on Tue May 19 16:03:44 2020@author: weiping"""import pandas as pdimport requestsimport urllib, sys from urllib import request as reqimport ssl,base64import timefrom lxml import etree#定义百度api图像识别接口def image_d.
2020-05-21 14:17:17 748
原创 阶段性总结--数据分析方法
目前大部分的企业领导都提过一个词“数据驱动”,大家似乎都知道在目前的数字经济概念下“数据”是时代和企业的新能源。很多互联网公司或者相关企业都在扩建自己的数据中心,大的企业开始搭建自己的数据服务中台,中小微或者创业型公司会购买性价比高,落地快的数据类产品。大体来说主要有两个方向,1.偏底层基础能力,搭建数据仓库,数据集市,形成报表对外输出;2.偏业务运营,对已有的数据深耕细作,名曰精细化运营。简而言...
2020-03-28 17:12:40 804
原创 杂思---分析方法
主要分为5种:行业分析、事件分析、产品分析、公司分析、用户分析行业分析(DEST)用于判断一个行业的前景,主要从这几个方面入手:P 政治环境,国家的政治导向,下一步规划方向与当前行业是否契合或者冲突;E 经济环境,当前的经济行情是否可以支撑的起来当前行业,经济的好坏对当前的行业的影响分别是什么;S 社会环境,目前社会风气,道德导向,人员架构以及下一步的社会问题对当前行业的是否有冲击等;T ...
2020-01-14 15:32:12 256
原创 杂思---消费分期
消费分期介绍 信用分期目前已经进入下半场,由线上转到线下,线下的第一批消金玩家-----捷信,主营手机等3c数码,当前线上流量饱和的情况下,一大批资金方开始涌入线下这个大市场,线下分期例如,教育,3c,旅游,医疗,美容,健身等会有大额支出的场景都会有分期的市场。线下的风险点主要集中在商户侧,例如前段时间的韦博英语事件等杂思 提前消费意识从线上进一步扩大的线下,优点...
2020-01-10 10:42:17 189
原创 tkinter 开发的 算卦小软件|python
# -*- coding: utf-8 -*-"""Created on Fri Nov 22 15:12:43 2019@author: weiping"""import tkinter as tkimport reimport requests import time'''0 坤、0001 乾、1112 兑、0113 离、1014 震、0015 巽、110...
2019-12-11 14:46:06 475
原创 Excel分表小软件代码|python
# -*- coding: utf-8 -*-"""Created on Tue Oct 29 09:27:32 2019@author: weiping --tkinter"""import tkinter as tkimport pandas as pd root = tk.Tk()root.title('分表')root.geometry('500x500')v...
2019-12-11 14:42:29 434
原创 各类图片下载网站
高清图片、视频素材网站汇总 版权说明:Creative Commons(知识共享)简称CC协议素材,创作者主动放弃著作的部分权利,还是会有所限制,例如要求标注来源、作者名等,请看到CC协议时看清须知。 PD协议证明作品已捐献给公共领域。 CC0协议意味着创作者主动放弃了著作的所有权利,可以无条件使用包括商用。(但是,不可上传至其他素材网站、不可声称拥有版权,不可用于不法途径,图像中所涉及...
2019-11-19 15:29:23 3015
原创 python|AdaBoost(AdaBoostClassifier)
# -*- coding: utf-8 -*-"""Created on Thu Nov 7 15:49:21 2019@author: weiping"""from sklearn.ensemble import AdaBoostClassifier as abcfrom sklearn.ensemble import AdaBoostRegressor as abrimp...
2019-11-07 16:07:33 1614
原创 python|随机森林(RandomForestClassifier)
# -*- coding: utf-8 -*-"""Created on Wed Nov 6 16:23:18 2019@author: weiping"""from sklearn.ensemble import RandomForestClassifier as rfcfrom sklearn.ensemble import RandomForestRegressor as...
2019-11-06 16:40:07 3656
原创 python|支持向量机(svm.SVC)
# -*- coding: utf-8 -*-"""Created on Tue Nov 5 16:30:52 2019@author: weiping"""from sklearn.svm import SVCimport pandas as pdimport numpy as npimport sklearn.datasets as skdataimport matpl...
2019-11-05 16:34:20 752
原创 python|决策树(DecisionTreeClassifier)
from sklearn.tree import DecisionTreeClassifier #分类from sklearn.tree import DecisionTreeRegressor #回归import pandas as pdimport numpy as npimport sklearn.datasets as skdataimport matplotlib.pyplo...
2019-11-04 18:00:42 3292
原创 python|逻辑回归(LogisticRegression)
# -*- coding: utf-8 -*-"""Created on Fri Nov 1 15:37:22 2019@author: weiping"""import pandas as pdimport numpy as npimport sklearn.datasets as skdataimport matplotlib.pyplot as pltfrom sk...
2019-11-01 18:35:51 1134
原创 利用python进行数据分析matplotlib_api入门
# -*- coding: utf-8 -*-"""Created on Tue Oct 29 09:27:37 2019@author: weiping"""import matplotlib.pyplot as plt import numpy as npimport pandas as pdplt.plot(np.arange(10))plt.show()fig,...
2019-10-29 10:54:08 217
原创 利用python进行数据分析pandas_字符串
# -*- coding: utf-8 -*-"""Created on Mon Oct 28 17:30:22 2019@author: weiping"""val = 'a,b , gudd , tt'val.split(',')pp = [x.strip() for x in val.split(',')]pp''' 字符串连接 '''a,b,c,d = pp...
2019-10-28 19:14:41 232
原创 利用python进行数据分析pandas_数据转换
# -*- coding: utf-8 -*-"""Created on Mon Oct 28 14:26:56 2019@author: weiping"""import pandas as pdimport numpy as npdf = pd.DataFrame({'k1':['a']*3 + ['b']*4, 'k2':[2,2,...
2019-10-28 17:29:31 290
原创 利用python进行数据分析pandas_数据重排
# -*- coding: utf-8 -*-"""Created on Fri Oct 25 16:41:03 2019@author: weiping"""import pandas as pdimport numpy as npdf1 = pd.DataFrame({'name':['a','b','c','d','f','g'], ...
2019-10-28 14:13:39 546
原创 利用python进行数据分析pandas_DataFrame1
# -*- coding: utf-8 -*-"""Created on Thu Oct 24 17:03:08 2019@author: weiping"""import pandas as pdimport numpy as npdata = np.array([[1,3,5,7], ['a','b','c','d'], [2001,2002...
2019-10-24 20:12:30 285
原创 利用python进行数据分析pandas_Series
# -*- coding: utf-8 -*-"""Created on Thu Oct 24 11:18:32 2019@author: weiping"""import pandas as pd'''Series'''ser = pd.Series([3,5,-6,9])serser.values #series 的数据值ser.index #series的索引...
2019-10-24 13:55:52 227
原创 利用python做数据分析--numpy模块
# -*- coding: utf-8 -*-"""Created on Mon Oct 21 09:59:52 2019@author: weiping"""import numpy as np '''一维数组'''data = [3,5,7,9]data*10 ## 结果是复制data10遍 data_n = np.array(data)data_n*10...
2019-10-23 16:05:58 178
原创 python协同过滤算法(仅供参考)
# -*- coding: utf-8 -*-'''@author: wp协同过滤'''import pandas as pdimport numpy as npclass Xietonggl(): def __init__(self,df,use_num ): self.df = df self.use_num = use_num ...
2019-07-08 18:12:17 810
原创 网站整理(持续更新)
在线画流程图的网址:https://www.processon.com/veer图库:https://www.veer.com/阿里巴巴矢量图库:https://www.iconfont.cn/可以在线练习Linux的网址:https://bellard.org/jslinux/在线制作词云图:https://wordart.com/办公资源网各类模板参考:...
2019-01-07 10:54:14 337
原创 Python实现ridge和lasso
# -*- coding: utf-8 -*-"""Created on Mon Nov 12 17:07:16 2018@author: wp:lasso|ridge """#经典鸢尾花数据集from sklearn.datasets import load_irisiris = load_iris()data_x = iris.data data_y = iris.t...
2018-11-12 17:48:13 2983
翻译 简单线性回归(ols)-py
简单的线性回归,主要是sklearn库的学习以及代码的实现http://scikit-learn.org/stable/index.html# -*- coding: utf-8 -*-"""Created on Thu Nov 1 16:51:59 2018@author: wp"""import matplotlib.pyplot as pltimport numpy a...
2018-11-01 17:29:16 1223
转载 linux 学习喽
linux终端小游戏 好玩嘞 https://blog.csdn.net/moy37rqw1jarn33bgzk/article/details/79395862
2018-09-06 09:16:43 136
原创 各种资料链接
Python 读取 数据库 到 dataframe: https://www.cnblogs.com/arkenstone/p/6271923.html
2018-08-01 14:25:30 538
转载 Python sklearn包的使用示例以及参数调优示例
coding=utf-8!/usr/bin/env python””’ 【说明】 1.当前sklearn版本0.18 2.sklearn自带的鸢尾花数据集样例: (1)样本特征矩阵(类型:numpy.ndarray) [[ 6.7 3. 5.2 2.3] [ 6.3 2.5 5. 1.9] [ 6.5 3. 5.2 2. ] [ 6.2 ...
2018-07-20 17:14:58 2565
转载 python3连接mysql数据库
由于Python统一了数据库连接的接口,所以 pymysql 和 MySQLdb 在使用方式上是类似的:pymysql.Connect()参数说明 host(str): MySQL服务器地址 port(int): MySQL服务器端口号 user(str): 用户名 passwd(str): 密码 db(str): 数据库名称 ch...
2018-07-03 14:59:40 1014
转载 pandas
一、生成数据表 1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as np import pandas as pd122、导入CSV或者xlsx文件:df = pd.DataFrame(pd.read_csv(‘name.csv’,header=1)) df = pd.DataFrame(pd.read_excel(‘name.xlsx’
2018-02-08 14:32:44 387
转载 Python教程:--Scipy
网址http://blog.csdn.net/q583501947/article/details/76735870
2017-12-27 21:53:09 731
转载 numpy手册
转载 先决条件在阅读这个教程之前,你多少需要知道点Python。如果你想从新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:PythonNumPy这些是可能对你有帮助的:ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常方便。matplotlib将允许你绘图Scipy在NumPy的基础上提
2017-12-19 17:34:48 456
转载 pandas中文速查手册
转载 本文翻译自文章:Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解。对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优化,使得和Python内置方法相比时有了很大的优势。如果你想学习Pandas,建议先看两个网站。(1
2017-12-19 16:45:26 409
转载 python常用指令
(转载) python os模块,平常操作文件方便,执行cmd命令Python的标准库中的os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。即它允许一个程序在编写后不需要任何改动,也不会发生任何问题,就可以在Linux和Windows下运行。 下面列出了一些在os模块中比较有用的部分。它们中的大多数都简单明了。 os.sep 可以取代操作系统特定的路径分
2017-12-18 13:05:43 9215
数据分析思维实战——竞品分析
2020-06-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人