自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 资源 (2)
  • 收藏
  • 关注

原创 产品需求文档PRD的相关内容

本文根据北风网产品经理培训课程整理而成的思维导图,包括了产品需求文档的内容、产品需求文档的评估点。内容版权属北风网所有,本文作为学习记录及传播知识用,不作商业用途。好好学习,天天向上。^_^ByEason 2019-11-04....

2019-11-04 22:05:50 392

原创 Matplotlib总结思维导图

也是去年10月做的。

2019-11-03 13:04:26 1315 1

原创 Seaborn总结思维导图

发现这个思维导图原来是18年10月份做的,学过的东西忘得差不多了。。。

2019-11-03 13:01:41 756

原创 数据挖掘实践学习一 数据集处理 未完待续

前言8月份参加的DataWhale组织的组队学习活动,自以为是地报了MySQL,数据挖掘和爬虫,结果只有MySQL完成得还可以了,数据挖掘不厚道地随便搞了一下,蒙混过关,爬虫搞了一半最后被请出了群聊。虽然没有完成,但好处保留了这些资料和高手们的聊天记录,现在想把没做完和做好的事情做完做好,可以照着别人的脚步,跟着做,这叫站在巨人的肩膀上。做的这些,当然都是为了一份工作。第一部分是...

2019-10-31 18:05:55 354

转载 Hacker house blues: My life with 12 programmers, 2 rooms and one 21st-century dream

(曾经在阮一峰的博客上看到的一篇文章,心中有一些感慨,对于走过不少弯路的自己来讲,如今也面临着困境,不再年轻了,这种种,是外界环境的作用,也是选择与坚持的结果)I came to San Francisco to change my life. I found a tribe of depressed workaholics living on top of one anotherI mi...

2019-10-28 10:20:38 264

原创 市场需求分析思维导图

2019-10-27 15:31:27 2765

原创 商业需求分析思维导图

根据一个培训视频整理而来

2019-10-25 12:17:13 843

原创 市场细分麦肯锡八法

2019-10-24 14:27:47 1855

原创 数据分析报告思维导图

2019-10-24 11:26:48 2210

原创 互联网数据分析指标体系(待完善!)

互联网行业有各种各样的指标,我尝试着将他们归纳到一个思维导图里面,但有些指标可能同时属于多种类型,比如说,跳出率,可以是用户行为的指标,也可以网站运营的指标。下面的图参考了一些文章,做了一个初步的归纳,慢慢再完善。...

2019-10-24 11:08:05 1022 1

原创 数据分析の杜邦分析法

好了,杜邦分析法在财务上是把净资产收益率作为一个总指标,然后对其进行分解成分其他财务指标,以此来评估企业的财务状况和经营业绩。净资产收益率主要分解为一下三部分:权益乘数:反映企业的负债状况,涉及到资产负债率,即总负债与总资产的比率。一般企业负债率高,说明企业能利用资本负债换取利益的能力,即拿别人的钱来赚钱,但企业整体风险也会高,资不抵债,企业就会破产。销售净利率:反映一个行业或一个企...

2019-10-18 14:27:52 2074

原创 数据分析常用的方法论

数据分析需要以营销或管理的理论作为支撑,其中涉及到的理论模型大致有:一、营销理论模型:4P模型,即Product产品,Price价格,Place渠道,Promotion促销。4P理论一般用于分析公司整体的经营环境。 用户使用行为模型。用于用户行为研究。 STP理论。 SWOT模型。二、管理理论模型:PEST模型,即Political政治,Economic经济,Soc...

2019-10-17 21:43:39 1099

原创 DataWhale 组队学习数据挖掘实践 任务六

模型融合方式任意,并结合Task5给出你的最优结果。例如Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。模型融合没学过,先跟着网上的教程做一遍,待花时间再好好研究一下。。。。导入各个模型from sklearn import svmimport xgboost as xgbfrom sklearn.ense...

2019-08-19 18:21:55 150

原创 DataWhale 组队学习数据挖掘实践 任务四 和 五 模型调优 和 K折交叉验证

任务5:使用网格搜索法对5个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果。 注: 由于时间限制,这里的任务我只做SVM的先吧导入必要的包# 最优参数选择from sklearn.model_selection import GridSearchCV# KNNfrom sklearn.neighbors import KNeighbo...

2019-08-19 17:06:11 307

原创 DataWhale 组队学习MySQL 任务四 已完成于2019-09-05

项目十六 分数排名 (难度:中等)依然是昨天的分数表,实现排名功能,但是排名需要是非连续的,如下:+-------+------+| Score | Rank |+-------+------+| 4.00 | 1 || 4.00 | 1 || 3.85 | 3 ||3.65 | 4 || 3.65 | 4 || 3.50 | 6 |+-----...

2019-08-18 14:33:50 197

原创 DataWhale 组队学习MySQL 任务三

项目十: 各部门工资最高的员工(难度:中等)创建Employee表,包含所有员工信息,每个员工有其对应的Id, salary 和 department Id。+----+-------+--------+--------------+| Id | Name | Salary | DepartmentId |+----+-------+--------+-------------...

2019-08-14 21:45:25 199

原创 DataWhale 组队学习数据挖掘实践 任务三 和 四

任务3 - 建模用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,评分方式任意,如准确率等。(不需要考虑模型调参)一、 使用逻辑回归from sklearn.linear_model import SGDClassifier1 初始化模型log_reg = SGDClassifier(loss='log',penalty='l2',max_iter = ...

2019-08-14 14:05:35 175

原创 DataWhale 组队学习MySQL 任务二

项目三:超过5名学生的课(难度:简单)创建如下所示的courses 表 ,有: student (学生) 和 class (课程)。例如,表:+---------+------------+| student | class |+---------+------------+| A | Math || B | Engl...

2019-08-12 10:15:08 183

原创 DataWhale 组队学习爬虫 Task3

Task3 安装selenium并学习和学习IP相关知识3.1 安装selenium并学习安装selenium并学习。使用selenium模拟登陆163邮箱。163邮箱直通点:https://mail.163.com/ 。参考资料:https://blog.csdn.net/weixin_42937385/article/details/881503793.2 学习IP相关...

2019-08-11 16:38:35 158

原创 DataWhale 组队学习爬虫 Task2 补充(爬取微博)

1. 首先,我们要把电脑网页版的微博页面在流浪器中转为手机端的页面,这里最好使用谷歌浏览器,按F12,点击下面按钮变成手机端模式:然后搜索并进入新浪微博,在微博搜索栏搜索LYH,点击头像进去他的主页:2. 在Network功能下,我们刷新一下网页,然后再逐个XHR下去看,name列表中哪个是微博内容对应的。3. 找到了这个东西后,在Headers下找到Url,Reqe...

2019-08-09 12:47:24 252

原创 DataWhale 组队学习爬虫 Task2

任务描述:2.1 学习beautifulsoup 学习beautifulsoup,并使用beautifulsoup提取内容。 使用beautifulsoup提取丁香园论坛的回复内容。 丁香园直通点:http://www.dxy.cn/bbs/thread/626626#626626 。 参考资料:https://blog.csdn.net/wwq114/ar...

2019-08-08 22:51:43 246

原创 DataWhale 组队学习数据挖掘实践 任务二

任务2 - 特征工程(2天)特征衍生特征挑选:分别用IV值和随机森林等进行特征选择……以及你能想到特征工程处理由于之前没有接触过IV值,昨天也在准备一个面试,因此特征工程的任务先简单地完成吧,过两天有时间再完善。用随机森林进行特征选择用sklearn建立随机森林模型from sklearn.ensemble import RandomForestClass...

2019-08-08 17:22:22 318

原创 DataWhale 组队学习爬虫 Task1

使用urllib库1. 使用urlopen实现简单的get请求import urllib.requesturl = 'http://www.baidu.com'response = urllib.request.urlopen(url)print(type(response)) #返回response的类型response是一个HTTPResponse类型的对...

2019-08-06 17:18:35 186 1

原创 DataWhale 组队学习MySQL 任务一

任务一:创建一个新的数据库:create database DataWhale;use DataWhale;项目一:创建一个新表emailcreate table email(id int not null primary key,Email varchar(255));插入数据:insert into email(id, email) values...

2019-08-05 17:25:35 154

原创 DataWhale 组队学习数据挖掘实践 任务一

任务1 - 数据分析(2天)数据集下载这是我们本次实践数据的下载地址https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签:0表示未逾期,1表示逾期。数据集涉密,不要开源到网上,谢谢~要求:数据切分方式 -...

2019-08-05 13:45:58 328

原创 利用Python进行数据分析(十四) - 几个案例

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-29 15:17:41 1052 1

原创 利用Python进行数据分析(十三) - Python建模库介绍

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。Patsy创建模型描述这一节云里雾里,看不明白。

2019-07-14 15:14:18 327

原创 利用Python进行数据分析(十二) - pandas高级应用

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-13 20:39:02 192

原创 利用Python进行数据分析(十一) - 时间序列

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-11 23:46:03 175

原创 利用Python进行数据分析(十) - 数据聚合与分组运算

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-10 18:53:59 143

原创 利用Python进行数据分析(八) - 数据规整:聚合、合并和重塑

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-09 17:24:45 156

原创 利用Python进行数据分析(七) - 数据的清洗和准备

还是白色好看点注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-08 22:18:42 171

原创 利用Python进行数据分析(六) - 数据加载、存储和文件格式

注:本文根据《利用Python进行数据分析》总结而来,内容版权归原作者所有。

2019-07-07 18:44:23 650

原创 Agile 和 Jira 总结(思维导图)

参考:【Agile Practice 总结】https://blog.csdn.net/weixin_34380296/article/details/87541501【Introduction to JIRA & Agile Project Management】https://www.youtube.com/watch?v=NrHpXvDXVrw...

2019-07-04 15:52:30 2184

原创 可以用来构造Pandas DataFrame的数据源格式

以上图片截取自利用python进行数据分析的中文翻译。感谢翻译者。构造DataFrame的数据格式import pandas as pdimport numpy as np二维ndarrayarr2d = np.random.randint(0,9,size=(5,4))arr2darray([[6, 3, 0, 4], [2, 5, 5, 0], ...

2019-07-02 18:37:45 913

原创 2019-07-01 只是面试的一些记录

接到OOOO的面试电话其实挺好奇,本身并不是做流程管理的,但却被邀请去面这个岗位。猎聘上的招聘信息,看到除了一些通用模板式的要求,也从中了解到了一个叫IPD的东西。周六日就花了两天时间准备这次的面试,关于自我介绍,关于个人对流程的建立和优化的理解,现在使用的哪些关于流程管理的工具和具体怎么使用,流程出现问题如何去解决,以及关于KPI和OKR的区别。其中有一些是已经在以往的工作中有所...

2019-07-01 17:37:20 162

转载 所谓的集成产品开发(IPD)

因为要去面试一个流程管理的岗位,涉及到IPD,所以做了点功课,这公司内部多年前的一个blog,内容上不涉及business confidential,所以转载到这里来共享。 对于IPD这套流程管理系统的实践,IBM可以说是鼻祖,对90年代IBM的起死回生起到了很关键的作用,后来听说华为请了IBM作为顾问,全套搬了过去,然后华为自己又不断地改进使之符合自身的需要。...

2019-06-30 20:43:25 2608

原创 MySQL基础总结(思维导图)

最近在找工作,把之前学过并自己总结的一些MySQL基础知识再过一遍。SQL实战练习题 https://www.nowcoder.com/ta/sql

2019-06-22 21:49:32 1883 2

原创 VBA下载文件 使用WebBrowser 及 DoFileDownload

一、启动WebBrowser在Excel打开时启动:先激活WebBrowser所在的表,继而在表激活事件中激活WebBrowser,在WebBrowser定位到网页。1:在workbook启动时激活该webbrowser所在的worksheetPrivate Sub Workbook_Open() ThisWorkbook.Worksheets("web").Activat...

2019-06-16 13:11:18 10464

原创 windows下安装xgboost

xgboost GitHub 源码包下载,解压https://github.com/dmlc/xgboost下载xgboost.dllhttp://ssl.picnet.com.au/xgboost/将xgboost.dll放到解压后的\xgboost-master\python-package\xgboost目录中进入\xgboost-master\python-packag...

2018-10-17 23:39:59 523

TASK01_20190805.ipynb

预测贷款用户是否会逾期。表格中 "status" 是结果标签:0表示未逾期,1表示逾期。 要求:数据切分方式 - 三七分,其中测试集30%,训练集70%,随机种子设置为2018 对数据进行探索和分析。 数据类型的分析 无关特征删除 数据类型转换 缺失值处理 ……以及你能想到和借鉴的数据分析处理

2019-08-05

xgboost gpu版本 xgboost.dll

xgboost GitHub 源码包下载,解压 https://github.com/dmlc/xgboost 下载xgboost.dll 将xgboost.dll放到解压后的\xgboost-master\python-package\xgboost目录中 进入\xgboost-master\python-package, 执行 python setup.py install

2018-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除