商业大数据
文章平均质量分 69
叶老师讲大数据
这个作者很懒,什么都没留下…
展开
-
商业大数据分析94问
一、概念什么是商业模式:B2B/B2C/B2B2C/C2B/B2VC什么是商业运作:供应链-产品/服务-销售渠道-(营销/风控)-用户-售后客服->财务表现+数据表现商业运作组织有哪些: 前线(销售/渠道/业务)-中台管理(市场/运营/公关)-后台支持(客服/供应链/开发)-战略决策(总办)商业运作组织关心什么:前线(卖货收钱)-中台(品牌客户产品线助力营销)-后台(供应质量服务)-战略决策(往哪走/走多远/走多快)解决商业问题的能力: 权力-魅力-创造力-协调力-执行力-数据分析能力什么转载 2021-09-23 11:35:29 · 540 阅读 · 0 评论 -
建立模型
建立模型的流程建模前的准备(即数据预处理)缺失值处理a) 删除之:应用场景缺失值相对于总数据样本而言是非关键少数。b) 统计量填补:应用的统计量有均值、中位数、回归模型预测值。数据标准化例如:进行数据标准化的主要原因:a) 统一变量量纲。b) 同分布变量:标准化后的变量均值为0,标准差(即方差)为1。异常值排查近似概念:异常值、离群值、极端值。关键区分是 真实存在(重点分析之) 还是 明显错误(删除或者修正之)。模型的选择与建立有监督学习(简称:监督学习)也就是上图中原创 2021-05-12 07:50:20 · 1339 阅读 · 0 评论 -
将Excel通过Navicat导入MySQL时中文编码和日期的问题汇总
问题描述中文乱码导入时报[ERR] 1366的错误。如果中文字段是主键则会因为乱码导致不唯一报[ERR] 1062的错误在Excel中日期格式为“年/月/日”,使用Navicat V11导入时按照“YMD”格式会出现日期计算错误,出现结果都为“1900-01-01”这样的错误。但是,在Navicat V15上未见这个错误。问题解决MySQL中文编码的问题,可以参考《彻底解决mysql中文乱码》设置,建议设置为utf8。其实,不论是数据库连接,还是表格编码也建议设置为uft8。当然,只要在原创 2021-04-22 17:45:59 · 873 阅读 · 0 评论 -
数据预览
数据介绍与说明的内容数据来源给出具体的网址,例如:样本数据来自国家统计局官方网站(https://data.stats.gov.cn/)样本数量 与 每条观测含义例如:数据包含xxx个样本(每条为一个样本),每条观测代表…变量的个数 与 基本情况例如:数据集共包含xxx个变量,可以被归纳成为2组,一组代表xxx,另一 组代表xxx。输出形式:数据变量说明表数据描述输出形式:统计图、表和指标,如:箱线图、直方图、柱形图、折线图、散点图、饼图等作图步骤:1)明确数据的含义:类型、采集原创 2021-04-20 16:33:21 · 476 阅读 · 0 评论 -
数据的获取
公开的数据集国际货币基金组织(IMF)世界银行(World Bank)世界卫生组织(WHO)经济合作与发展组织(OECD)中国国家统计局UCI数据库天池Kaggle和鲸社区10.百度利用网络爬虫抓取数据网络爬虫(Web Crawler)用于搜索引擎:获得网页网址及对应内容,用来匹配用户搜索结果。用作数据获取工具:自动访问网页并记录网页对应的内容。网络爬虫需要面临运行时间长、失败率高、不可控因素多爬取网页的基本步骤a) 找到目标URL 或者 API数据源(例如:百度地图原创 2021-04-20 15:53:53 · 457 阅读 · 0 评论 -
数据介绍与描述性分析——以NBA球员薪酬影响因素分析为例
引言本项目使用的数据抓取自虎扑篮球网站(https://m.hupu.com/nba/players/salaries),共397条, 每条数据代表一个NBA球员的相关信息。年薪是NBA球员的主要收入来源,也是本文的研究目标,所以视为因变量。自变量归纳为个人能力和发展前景。个人能力包括进攻能力(得台数+助攻数+前场篮板数)、 防守能力(抢断数+盖帽数+后场篮板数)、是否入选过全明星和场均时间等变量;发展前景包悟球龄、年龄、场上位置、球队胜率和球队市值等变量。因变量y:球员年薪本项目研究的是2016-原创 2021-03-24 08:03:18 · 6462 阅读 · 1 评论 -
商业大数据分析报告选题与背景撰写技巧
1. 选题1) 选题的思考流程(1)确定一个行业或领域根据自己背景,选择一个最有可能掌握的行业或领域,并聚焦这个行业或领域的一个明确的话题。(2)确定选定行业或领域中扮演的角色不同的角色会面临不同的环境,产生不同的问题。(3)明确一个具体的问题针对一个具体的、可度量的问题进行研究,问题越小越好!2)选题的注意事项(1)选题是否具体、可度量、小而精(2)选题所用的数据是否可以获得(3)选题是否可持续地研究和改进(4)选题是否有价值(5)选题是否有大量的文献资料可以阅读和学习2. 背原创 2021-03-03 22:36:08 · 3390 阅读 · 3 评论 -
朴素的数据观
什么是数据数字、文本、声音、图像、社交链、车辆网数据具有强烈的时代特征数据的产生依赖一定的技术新型的数据还在不断产生中…问题:在可以预测的50年会有哪些新型数据?数据会带来哪些商业价值?商业价值三要素增加收入什么能够增加额外的收入?特别留意新兴市场,例如:交通拥堵保险。降低成本1)用机器代替人工,例如:机器播报新闻、呼叫中心的人工智能接入。2)产品寿命,例如:车窗马达的使用寿命由50万次降低为10万次 >> 节约上亿元。3)与产品设计,例如:电视机取消VGA接口原创 2021-01-24 20:34:31 · 180 阅读 · 0 评论 -
商业大数据研究选题
一. 餐饮行业:A菜品外卖对象:某家餐饮店是一家专营A菜品的外卖店(24小时营业)。业务:专注线上平台外卖,也有少量的线下堂食体验店。业务问题:1) 线下体验店如何选址2) 配送的菜品如何确定3) 如何体现自己的服务特色(营业时间、配送范围等)4) 消费者对A菜品的评价如何5) 这些问题的解决对该餐饮店选择菜品或提供服务有什么帮助提示:1) 确定餐饮店所在的有代表性的城市2) 数据来源:各类点评网站旅游行业:旅游产品的销量对象:旅游产品的定价业务:成本定价,毛利非常固定业务问题原创 2021-01-23 20:36:37 · 2677 阅读 · 0 评论 -
大数据时代“新装”
大数据时代与“皇帝的新装”风口:大数据时代的到来,大数据的4V特点 [Volume数据量、Variety形式多、Velocity速度快、Veracity真实性)主角:皇帝并不关心数据业务也不关注数据技术,只是想蹭“大数据”的时髦,以此炫耀,用大数据做他的“新衣服”可以挑选的大数据“新衣服”(范围由大到小依次):大数据>人工智能>数据挖掘>机器学习>深度学习骗子:大数据“砖家”错误的认为a) 统计分析:简单数据的简单分析b) 深度学习:复杂数据的复杂分析没说真话的大臣:原创 2020-12-30 21:48:29 · 278 阅读 · 0 评论