自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 superset 数据可视化探索中的遇到的timeout error

问题描述:sql Lab中sql正常跑出有结果,而在datasets中跑数据图表的时候报下图中出现的错误该问题属于超出前端等待时长未返回数据导致的,superset0.19.0版本之后只需要更改配置文件config.py中的配置就行,如下图中标绿的...

2022-03-08 16:21:30 528

原创 个人的信用体系(分层体系)调研

一、国内外征信体系信息概览国内公司 公司 侧重领域 通用信用分 数据来源 合作机构 客户群 优势 芝麻信用 生活场景 芝麻信用分 “阿里系”电商、“阿里系”参股企业、支付宝 30 余家行业龙头、融 360等 P2P 平台 金融机构和普

2022-03-02 09:50:50 797

原创 pandas高阶应用

1、时间序列相关操作pd的date_range中的基本时间序列频率 Alias Description(偏移量类型) 说明 B business day frequency 每工作日 C custom business day frequency 自定义工作日频率 D calenda

2022-02-22 10:41:10 770

原创 论文研读|基于注意力的深度学习如何实时预测购买还是浏览(DIPN)

原文链接:Buying or Browsing? : Predicting Real-time Purchasing Intent using Attention-based Deep Network with Multiple Behavior导读本文主要介绍如何利用用户与海量弱信号的手机交互数据对用户实时的购买行为进行预测。论文主要工作亮点一种新的用户交互行为数据的收集、特征提取及利用 层级注意力的应用多任务预测提升模型鲁棒性。相关工作购买意图预测在以往的预测目标是预测会话

2021-09-17 15:52:39 1090

原创 利用sklearn KNN实现手写数字识别

# 利用sklearn KNN实现手写数字识别import numpy as npimport pandas as pdfrom PIL import Imageimport matplotlib.pyplot as pltfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection imp.

2021-09-03 15:09:13 909

原创 Logistic Regression:逻辑回归推导过程

Logistic Regression:逻辑回归推导过程逻辑回归做分类,它用到回归的思想是一种广义的回归。物理原理:它先找到分类边界线y=wx+b,然后再带入到11+e−y\frac{1}{1+e^-y}1+e−y1​该函数的取值区间为(0,1),求出的是概率值,>0.5分类为1类,<0.5分类为0类。即:找到分类边界线的回归方程,带入逻辑斯蒂函数,得到概率值,依据概率值进行分类。以下是数学推导过程:其中用到指数求导四则运算,不明白的建议再复习下导数四则运算。逻辑回归不

2021-09-03 15:08:40 264

原创 Python实现简单的logistic

from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitimport numpy as npimport matplotlib.pyplot as plt#获取数据 获取两列data = load_iris().data[:100,[0,2]]target = load_iris().target[:100]plt.plot(data[:50,0],data[:.

2021-09-03 15:07:58 416

原创 A/B Test 必知必会

零、科学的、可信赖的、可重复的、可解释的一次可信赖的实验是什么样的?实验设计的科学性, -实验对象分配的独立随机性,实验过程的安全、可重复性, 实验数据的可靠性,实验分析结果的可解释性。0.1 实验设计背景知识0.1.1 实验设计的原则 对照性原则: 在实验设计中,通常设置对照组,通过干预或控制研究对象以消除或减少实验误差,鉴别实验中的处理因素同非处理因素的差异。 通常采用空白对照组:不给对照组加实验组的处理因素 随机性原则: 首先

2021-09-01 13:17:11 2135

原创 qichacha/知乎/国家统计局最新4级地区划/百度地图API获取经纬度/Google play app评论等分数据爬取

1、企查查数据抓取1.1 关键公司LOGO# -*-coding:utf-8-*-import pandas as pdimport requestsimport jsonimport randomimport timefrom lxml import etreeimport recookies = pd.read_csv('C:/Desktop/cookies.txt')# cookies2 = pd.read_csv('C:/Desktop/cookies2.txt').

2021-09-01 13:14:12 2460 1

geoInfo.csv

geoInfo.csv 地区及code

2021-09-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除