![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
商业分析项目集锦
文章平均质量分 68
SophiaSSSSS
这个作者很懒,什么都没留下…
展开
-
【Python】调取tushare和joinquant的数据写入本地MySQL数据库(推荐)(技术实现过程)
本次需求,源于数据建设项目小模拟_构建量化投资分析模型,其文字报告版发于个人知乎专栏 https://zhuanlan.zhihu.com/p/349686026。按照《构建量化投资分析模型_数据指标体系构建V0.2_20210309》的进度,先获取了基本面数据和技术面数据(另带一些基础数据);至于风险预警、行业评估、宏观环境等其他专题模块,迟些再搭建指标体系和获取数据。本篇CSDN帖子主要记录代码实现过程,不涉及更深入分析。完整版的分析报告,统一发布于个人知乎专栏<数据决策分析原创 2021-03-09 17:44:57 · 846 阅读 · 2 评论 -
houseprice_analysis_广州房子租售比分析(中)
续上篇,houseprice_analysis_广州房子租售比分析(上)https://blog.csdn.net/weixin_44216391/article/details/106457799"""由上,如果我们要对比租售比情况,可取二者共同信息是:salehouse:所在区域-板块(eg番禺-新塘北)、小区名称(eg锦绣天伦花园)、大小(eg 90.58平米)、楼龄(eg 2015年建)、总价(eg 178万)、均价(eg 19652元/平米)lendhouse:所在区域-板块(eg黄埔原创 2020-07-28 13:13:41 · 2559 阅读 · 0 评论 -
houseprice_analysis_广州房子租售比分析(上)
2020.5.31 在XXX等多重因素作用下,作为一棵跨了个行还未走上正轨的小韭菜瑟瑟发抖。虽然,城市产业链是变化的,JJ重心和JY情况也是动态的:我无法准确预测某个小区某个板块在未来3年、5年、10年甚至更久,是否还一如既往地繁荣,房子的价值是否一如既往地坚挺,那,就先看看当下,当下的其中一个因素——租售比。--------原创 2020-06-10 09:47:28 · 1233 阅读 · 0 评论 -
信贷风控评分卡模型(上)_Give Me Some Credit(技术实现过程)
本帖是在2019年5月初入门python之时,选取的较为系统的练手案例,主要内容是信用风险计量体系之主体评级模型的开发过程(可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡)。如今再回顾,结合前几月股票市场被割韭菜的切身体会,应该能应用这个模型来做股票市场的风险评级模型分析/收益评级模型分析。已经跃跃欲试了。——2020.11.6补充说明原创 2019-05-26 11:12:32 · 8486 阅读 · 11 评论 -
New York City Taxi Trip Duration纽约出租车大数据探索(报告版)
一、项目说明该项目来源于Kaggle,旨在建模来预测纽约出租车在行程中的总行驶时间。在建模预测的过程中,我们可以顺便探索纽约市民打车出行习惯及其他有效信息。附kaggle项目链接 https://www.kaggle.com/c/nyc-taxi-trip-duration/overview【注】CDSN博客编辑器体验不佳,本文排版格式失效且图片丢失。如需美观及完整,敬请移步知乎专栏。...原创 2019-05-12 16:46:24 · 9853 阅读 · 10 评论 -
【Python】New York City Taxi Trip Duration纽约出租车大数据探索(技术实现过程)
New York City Taxi Trip Duration纽约出租车大数据探索之行程时间预测# 该项目来源于Kaggle,旨在建模来预测纽约出租车在行程中的总行驶时间。# 在建模预测的过程中,我们可以顺便探索纽约市民打车出行习惯及其他有效信息。# kaggle项目链接 https://www.kaggle.com/c/nyc-taxi-trip-duration/overview...原创 2019-05-11 22:15:46 · 10247 阅读 · 24 评论 -
Bank Credit_个人贷款违约预测
# 本次case主题:个人贷款违约预测模型# 简单点的时候,一般会提供建模使用的宽表,我们可以建立一个逻辑回归模型并用其进行预测。但是当我们面临许多张原始客户或账户数据表时,很可能手足无措。# 建模的人都知道,构建建模宽表(属于特征工程最重要的部分,但是和机器学习中常提到的变量扩增、变量压缩算法是两码事)是商业数据分析中最难、最耗时、最考验数据科学家功底的环节。# 本案例使用一套真实的数据...原创 2019-05-07 11:38:29 · 3495 阅读 · 0 评论 -
Kaggle_Predict Future Sales_Prac 1(时间序列预测商品销量)
# 本次比赛目标:通过时间序列模型,预测接下来一个月,俄罗斯某商超集团每件商品在各个商店的总销售额。# 听说 Eviews 和 MATLAB 是经济金融界的利器,特别是在时间序列方面,二者优势得天独厚。# 我估摸着,就这个比赛项目来说,是不是直接把源数据拉进 Eviews,然后托拉拽就搞定了(此处偷笑)。# 好了回到正题,用Python打比赛。# 在共享开源的社区,参考着大神的帖子。虽然...原创 2019-04-29 16:41:12 · 10538 阅读 · 14 评论 -
【Python】Decision on buying cars COROLLA or LEVIN(数据分析技术实现过程之·2 data_analysis①)
# 前面已经对数据进行了初步清洗。Python暂时搞不定的,用excel先搞定了应应急。# 下面正式开始数据分析# 导入常用模块import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# 读取卡罗拉口碑数据文件corolla1=pd.read_csv("D...原创 2019-04-04 00:05:30 · 1028 阅读 · 0 评论 -
【Python】Decision on buying cars COROLLA or LEVIN(数据分析技术实现过程之·1数据清洗)
# 导入必备常用模块import pandas as pdimport numpy as np# 读取源数据——卡罗拉口碑corolla1=pd.read_csv("D:\\2018_BigData\\Python\\Projects_Entry\\Decision on buying cars COROLLA or LEVIN\\2019-3-28-corolla-source.csv...原创 2019-04-01 19:23:16 · 2467 阅读 · 2 评论 -
用Python数据分析来辅助汽车选购决策(雷凌vs卡罗拉)(持续更新ing)
注:随Python技能更新,分析报告也持续更新中。数据来源数据来源于汽车之家网站雷凌及卡罗拉两个车型口碑频道中车主对车辆从各维度的文字点评,每篇口碑的字数平均在500-2000字。数据分布雷凌车型口碑有效样本340个卡罗拉车型口碑有效样本405个【卡罗拉vs雷凌】概述各地区裸车价格对比……产品总体评价对比各关键因素口碑指数对比:功能、动力、空间等可用聚类热图,也可用条形图可...原创 2019-04-01 19:40:57 · 1822 阅读 · 0 评论 -
【Python】Kaggle_Titanic_prediction 1 -- logistics regression逻辑回归预测
Kaggle泰坦尼克号沉船生存预测,已经是数据挖掘界国际经典入门案例了。那,小试“牛”刀。# 导入常用数据模块import pandas as pdimport numpy as np# 导入训练集数据文件train1=pd.read_csv("D:/2018_BigData/Python/Kaggle_learning/Titanic Machine Learning from D...原创 2019-04-09 16:12:52 · 754 阅读 · 0 评论 -
【Python】Kaggle_Titanic_prediction 2 -- random forest 随机森林预测
总结:随机森林预测最后准确率最高为0.785,kaggle排名4158/10972(38%)-2019.4.11。没有达到大神帖子说的0.81,可能是特征还可以处理到更佳;又或者,一些离散比较大的变量例如 Fare,应该先做 scale 处理,减少机器学习的误差。不想在Titanic这个项目上耽误太久,所以scale留着下一个项目如果有机会再试。奔向下一个项目:predict-future-...原创 2019-04-11 19:41:21 · 1401 阅读 · 0 评论 -
用Python分析用户消费行为 Student Comsumption Analysis ①
# 本次案例:用户消费行为分析# 借用阿里天池【数智教育_数据可视化创新大赛】数据源中的学生消费数据来作为本次用户消费行为分析的数据来源。# 阿里天池数智教育数据可视化竞赛网址 https://tianchi.aliyun.com/competition/entrance/231704/introduction?spm=5176.12281949.1003.6.7b4576d8HSXTTc...原创 2019-04-15 12:29:02 · 4016 阅读 · 5 评论 -
用Python分析用户消费行为 Student Comsumption Analysis②
# 【续】本次案例:用户消费行为分析# 借用阿里天池【数智教育_数据可视化创新大赛】数据源中的学生消费数据来作为本次用户消费行为分析的数据来源。# 阿里天池数智教育数据可视化竞赛网址 https://tianchi.aliyun.com/competition/entrance/231704/introduction?spm=5176.12281949.1003.6.7b4576d8HSXT...原创 2019-04-16 11:17:59 · 3090 阅读 · 5 评论 -
【Power BI+Excel+Python】2019年4月全国数据分析招聘岗位可视化分析
前言近几年来,大数据、人工智能、云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲。那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要哪些技能?薪酬竞争力如何?集中在哪些行业需求较多?接下来,以2019.4.23拉勾网最新发布职位数据为例,一窥数据分析职位现状。一、研究问题1、全国数据分析岗位的需求主要分布在哪些区域、行业?...原创 2019-04-23 18:29:48 · 3680 阅读 · 3 评论