自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 资源 (1)
  • 收藏
  • 关注

原创 文本分类tensorflow keras keras-bert tensorflow-gpu版本匹配

好久没登录了 主要是在挣扎着实习和毕设昨晚又非常痛苦地配环境到半夜 主要因为kears-bert直接装装的是0.86 还会自动把kears更新到2.4.3导致和tensorflow不匹配 如果更新tensorflow又会导致gpu版本不匹配 更新gpu又会导致和服务器装的cuda不匹配 但如果回去装旧的keras-bert有的函数又还没有【无限循环没怎么搜到人写我想看到的匹配 搜到的用的版本都比较旧了 就自己记一下现在能跑起来的环境吧windowspython 3.7.3gensim 3.8.3

2021-02-14 13:51:44 2184 4

原创 Video Game Sales数据分析

数据集:https://www.kaggle.com/gregorut/videogamesales/data字段:Rank - Ranking of overall sales 总销售额排名Name - The games name 游戏名称Platform - Platform of the games release (i.e. PC,PS4, etc.) 发布平台Year - Year of the game's release 发布年份Genre - Genre of.

2020-05-24 18:16:31 2736 3

原创 tensorflow踩坑安装

非常痛苦的安装经历 整了一天一直用的python版本是3.7anaconda原来tensorflow版本中虽然python是3.5 但是pip的版本过低没法直接install 想升级pip又不起作用最后的选择是:1、重新建立一个虚拟环境python3.5 名为py352、activate py353、如果直接upgrade pip的话更新的是外边的pip 所以需要在pyt...

2020-05-06 12:43:29 363

原创 房价预测2

学习:https://blog.csdn.net/u012063773/article/details/79349256https://www.cnblogs.com/massquantity/p/8640991.htmlhttps://zhuanlan.zhihu.com/p/39429689详解stacking过程之前在房价预测1中对一些异常值进行了drop处理 后来...

2020-04-25 18:06:00 667

原创 房价预测1

数据集:https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data参考:字段:(字段下的具体分类因为太多了就不写了MSSubClass:参与销售的住宅类型 包含层数、年份等MSZoning:一般分区分类 农业、商业、工业、住宅密度等等LotFrontage:连接到房子的街道...

2020-04-15 21:52:29 1329

原创 4.11网易互娱笔试知识点补充

啥 也 不 会delete drop removeSQL的drop,delete,remove,update和truncate之间的区别delete:删除满足条件的某行/表内所有行Delete * from table表名 where……Delete from table表名drop:删除数据表/数据库/数据表字段删除数据表时 表的结构、属性、索引也会...

2020-04-12 14:20:38 569

原创 数据分析常用方法&思路&算法

目录分析方法论SWOT4P:产品、价格、促销、渠道PESTSMART5W2H用户使用行为AARRR思路趋势分析多维分解用户分群漏斗分析留存分析A/B 测试对比分析交叉分析算法回归算法线性回归Linear Regression二元logistic回归Logistic Regression分类算法决策树随机...

2020-04-05 00:46:04 3010

原创 秦路数据分析统计学笔记

分类数据描述统计频数统计:各分类计数频数百分比数值数据描述统计统计度量:平均数 中位数 众数 四分位数quartile(第一分位数25% 第二分位数=50%中位数 第三分位数75%) 方差VAR.P 标准差STDEVP图形...

2020-04-04 18:08:13 502

原创 泰坦尼克号生存预测

学习机器学习之特征工程使用sklearn做单机特征工程参考kaggle 泰坦尼克号生存预测——六种算法模型实现与比较Kaggle初体验-机器学习之泰坦尼克号乘客生存预测(上)猴子数据分析之泰坦尼克号生存率预测数据集:https://www.kaggle.com/c/titanic字段Age:年龄Cabin:船舱号Embarked:登船港口 C...

2020-04-01 16:46:07 7546 5

原创 数据分析药店销售项目

字段购药时间:格式为“2018-01-01 星期五”社保卡号:一个卡号代表一个人商品编码:一个编码未必只对应一个商品 还存在一个商品有两个编码的情况商品名称:购买商品的名称销售数量:售出的该商品数量应收金额:应收取的金额实收金额:实际收取的金额 有的与应收金额不同 可能是打折 但同样的应收金额也存在与实收金额相等的情况 所以也可能是...

2020-03-27 16:18:42 1330 1

原创 秦路数据分析sql笔记

取数select * from 数据库.表名select 列名,列名 from 数据库.表名限制100条数据:select * from 数据库.表名 limit 100按顺序排列 中文升降序没有显著区分:select * from 数据库.表名 orderby 列名 (desc降序)排序&限制:select * from 数据库.表名 orderby 列...

2020-03-25 19:25:50 323

原创 秦路数据分析excel笔记2图表

散点图变种:气泡图 单轴散点图 可以通过坐标轴选项修改为象限图客户消费维度消费金额和消费次数的关系消费金额和最后一次距今消费天数的关系消费次数和最后一次距今消费天数的关系客户其他消费维度消费金额和消费折扣的关系消费金额和会员积分的关系消费次数和会员距离的关系垂直领域消费维度投资金额和投资次数的关系(金融)最近一次距今消费和使用次数(SAAS)...

2020-03-25 00:30:23 438

原创 秦路数据分析excel笔记1函数

常见文本清洗函数乱码问题:txt打开后再复制到excel 或使用其他转编码工具find:确定字符位置=find(find_text,within_text,start_num)Find(要查找的文本,文本所在的单元格,从第几个字符开始查找[可选,省略默认为1,从第一个开始查找])substitute:替换字符=substitute(text,old_text,n...

2020-03-24 21:16:33 261

原创 秦路数据分析业务笔记2

建立业务分析框架1、从指标的角度出发2、从业务的角度出发3、从流程的角度出发:业务落地后的闭环市场营销模型每个部分都能变为具有结构化思维的细分部分AARRR模型用户行为模型(内容平台)电子商务模型网站流量模型...

2020-03-24 01:12:27 223

原创 秦路数据分析业务笔记1

理解业务知识才能建立业务数据模型,实现分析落地经典业务分析指标市场营销1、客户/用户生命周期努力维护用户关系2、用户价值/贡献3、RFM模型有的行业更关注R:因为获取新用户成本高 预防流失4、用户分群:价值度 流失度产品运营1、AARRR实际运用中未必有先后逻辑2、用户获取:渠道到达量 渠道转化率 渠道RO...

2020-03-24 00:43:46 222

原创 秦路数据分析思维笔记

https://www.bilibili.com/video/BV1MW411975G?p=3what 三种核心思维结构化错误案例:修改为金字塔模型:公式化业务化如何预估上海共享单车的投放量单车是有损耗的 计算公式中应该考虑单车的损耗因素why 数据分析的思维技巧象限法...

2020-03-23 21:39:22 462

原创 淘宝用户行为模式数据分析案例

数据集:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46字段user_id:用户身份item_id:商品IDbehavior_type:用户行为类型(点击、收藏、加购物车、支付,分别用数字1、2、3、4表示)user_geohash:地理位置item_category:品类ID(商品所属品类)time:...

2020-03-23 13:23:47 2687

原创 电商平台零售交易数据分析案例part2

数据分析取出退货的订单 使用透视图进行观察df1 = df.loc[df['Quantity'] <= 0]#使用透视图分析tt = pd.pivot_table(df1,index=['year'],columns=['month'],values=['amount'],aggfunc={'amount':np.sum},margins=False)取出除退货订单以外...

2020-03-22 17:27:43 1780

原创 电商平台零售交易数据分析案例part1

av81847305数据集:https://www.kaggle.com/lakshmi25npathi/online-retail-dataset为了不花钱买 强行从kaggle上对比着名字和大小找到了这份数据就是要等待它以20kb/s左右的速度下载发现我kaggle的账号还是之前上挖掘课的时候注册的dm+学号 且改不了……字段:InvoiceNo:订单编号,...

2020-03-21 21:42:44 2994 5

原创 excel数据处理技巧笔记

from万门大学1、数据透视表2、条件格式使用公式时用F4/fn+F4可以锁定数据标记涨跌:使用条件格式(相对单元格)+格式刷

2020-03-19 21:02:42 1550

原创 数据分析python matplotlib简单实践笔记3

av6989413极坐标import matplotlib.pyplot as pltimport numpy as npr = np.arange(1,6,1)theta = [(np.pi/2)*i for i in range(5)]ax = plt.subplot(111,projection='polar')ax.plot(theta,r,color='...

2020-03-17 16:52:13 211

原创 数据分析python matplotlib简单实践笔记2

av6989413一张图内生成多个子图x=np.arange(1,100)fig=plt.figure()#参数分别为:子图总行数,子图总列数,子图位置ax1 = fig.add_subplot(221)ax1.plot(x,x)ax2 = fig.add_subplot(222)ax2.plot(x,-x)plt.show()也可以直接使用plt.su...

2020-03-17 14:07:50 270

原创 数据分析python matplotlib简单实践笔记1

av6989413散点图import matplotlib.pyplot as pltimport numpy as npN = 1000x = np.random.randn(N)y = np.random.randn(N)plt.scatter(x, y)plt.show()参数:https://blog.csdn.net/anneqiqi/arti...

2020-03-17 01:12:06 187

原创 数据分析airbnb案例

Task:预测NYC的房屋价格airbnb['price'].describe 对price字段的理解:min为0,是真实数据抑或错误数据max为10000,是真实数据抑或错误数据中位数比平均值要小用describe函数观察所有字段并对字段具体表示内容进行了解先粗略分析price与哪个字段相关:猜测:neighbourhood,room_type,minin...

2020-03-15 00:43:02 990

原创 数据分析运营数据案例笔记

·av68916814流量指标:PV:APP总访问量 UV:APP独立访问数还可以根据时间、日期等进行追踪,查看用户访问规律数据清洗公式:1、缺失值统计:isnull().sum()shape方法2、缺失值处理:drop方法删除补全筛选方法3、数据类型归一:整数astype(int)浮点数astype(float)时间处理...

2020-03-14 00:31:04 1051

原创 数据分析电商案例常见角度

·av689168141、订单维度:笔单价和连带率是多少?订单金额与订单内商品件数的关系如何?2、客户维度客单价是多少?客户消费金额与消费件数的关系如何?3、商品维度商品的价格定位是高是低?哪种价位的商品卖得好?哪种价位的商品带来了实际上最多的销售额?4、时间维度各年/月/日的销售情况是什么走势?可能受到了什么影响?...

2020-03-12 23:09:10 252

原创 数据分析python pandas简单实践笔记

·av68916814输出csv文件后再使用图表秀绘图iloc,loc的使用:https://blog.csdn.net/w_weiying/article/details/81411257功能为取某一行,简单来说大概是iloc用数字索引,loc用行名称索引取某行某列: iloc[0,0] loc['行名','列名' ].groupby(' '):按' '分组...

2020-03-12 18:31:24 203

原创 数据透视表简单使用所遇问题1:日期分组字段

在用金老师所给的商业模拟数据进行学习使用数据透视表时,遇到无法将日期进行分组字段设置的问题。最后解决方案如下:1、在原始数据中,对订单日期这一列取消单元格合并;2、对该列使用“分列”操作;3、刷新数据透视表,此时选中其中一格日期时分组字段已可进行点击。根据搜索到的其他人的经验,如果源数据中存在空白字段,仍可能出现此错误,需要对数据进行预处理。...

2020-03-11 22:25:49 1612

原创 数据分析问题分类笔记

·av68916814·西瓜分类基于决策树挑选西瓜https://www.cnblogs.com/laresh/p/7676170.html·泰坦尼克存活预测乘客是否存活https://www.cnblogs.com/shengyang17/p/9966976.htmlhttps://zhuanlan.zhihu.com/p/70331455h...

2020-03-11 17:00:21 517

原创 数据分析统计学基础笔记

·av68916814·均值·标准差:偏离均值·正态分布:最高点为均值 95%的数据处在两个标准差之间 可查表·中心极限定理:n次取样,无论全体是什么分布,样本均值是正态分布例子:(原文链接:https://blog.csdn.net/qq_25366173/article/details/80151629)现在我们要统计全国的人的体重,看看我国...

2020-03-11 01:10:12 600

原创 算法作业 NP-complete problems 8.22

8.22 In task scheduling,it is common to use a graph representation with a node for each task and  a directed edge from task i to task j if i is a precondition for j.This directed graph depicts the p

2017-07-06 18:23:29 403

原创 53. Maximum Subarray

Find the contiguous subarray within an array (containing at least one number) which has the largest sum.For example, given the array [-2,1,-3,4,-1,2,1,-5,4],the contiguous subarray [4,-1,2,1]

2017-06-18 20:25:26 201

原创 121. Best Time to Buy and Sell Stock

Say you have an array for which the ith element is the price of a given stock on day i.If you were only permitted to complete at most one transaction (ie, buy one and sell one share of the stock),

2017-06-06 18:52:11 174

原创 343. Integer Break

Given a positive integer n, break it into the sum of at least two positive integers and maximize the product of those integers. Return the maximum product you can get.For example, given n = 2, ret

2017-06-01 19:08:56 197

原创 338. Counting Bits

Given a non negative integer number num. For every numbers i in the range 0 ≤ i ≤ num calculate the number of 1's in their binary representation and return them as an array.Example:For num = 5

2017-05-26 00:52:21 202

原创 357. Count Numbers with Unique Digits

Given a non-negative integer n, count all numbers with unique digits, x, where 0 ≤ x n.Example:Given n = 2, return 91. (The answer should be the total numbers in the range of 0 ≤ x [11,22,33,4

2017-05-25 21:38:49 196

原创 401. Binary Watch

A binary watch has 4 LEDs on the top which represent the hours (0-11), and the 6 LEDs on the bottom represent the minutes (0-59).Each LED represents a zero or one, with the least significant bit o

2017-05-18 01:03:10 182

原创 409. Longest Palindrome

Given a string which consists of lowercase or uppercase letters, find the length of the longest palindromes that can be built with those letters.This is case sensitive, for example "Aa" is not c

2017-05-13 18:08:02 192

原创 504. Base 7

Given an integer, return its base 7 string representation.Example 1:Input: 100Output: "202"Example 2:Input: -7Output: "-10"Note: The input will be in range of [-1e7, 1e

2017-05-12 00:32:18 164

原创 169. Majority Element

Given an array of size n, find the majority element. The majority element is the element that appears more than ⌊ n/2 ⌋ times.You may assume that the array is non-empty and the majority element

2017-05-04 01:29:45 159

video game sales.zip

video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle video game sales数据集from kaggle

2020-09-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除