城南以东
码龄6年
关注
提问 私信
  • 博客:20,226
    20,226
    总访问量
  • 7
    原创
  • 1,807,930
    排名
  • 10
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2018-08-26
博客简介:

城南以东的博客

查看详细资料
个人成就
  • 获得16次点赞
  • 内容获得5次评论
  • 获得167次收藏
  • 代码片获得2,598次分享
创作历程
  • 7篇
    2020年
成就勋章
TA的专栏
  • nonebot2
  • CI/CD
  • 面试题
  • 学习笔记
  • python数据分析与挖掘实战
    5篇
  • python数据分析项目
    2篇
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

182人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python数据分析与挖掘实战---chapter10家用电器用户行为分析与事件识别

1. 项目背景与挖掘目标1.1 背景居民在使用家用电器过程中,会因地区气候、不同区域、用户年龄性别差异,形成不同的使用习惯。家电企业若能深入了解不同用户群的使用习惯,开发新功能,就能开拓新市场。要了解用户使用家用电器的习惯,必须采集用户使用电器的相关数据下面以热水器为例,分析用户的使用行为。在热水器用户行为分析过程中,用水事件识别是最关键的环节。比如,国内某热水器生产厂商新研发的一种高端智能热水器,在状态发生改变或者有水流状态时,会采集各监控指标数据。该厂商根据其采集的用户的用水数据,分析用户的用水行
原创
发布博客 2020.09.14 ·
2141 阅读 ·
1 点赞 ·
1 评论 ·
19 收藏

python数据分析与挖掘实战---chapter8中医证型关联规则挖掘

1. 项目背景恶性肿瘤俗称癌症,当前已成为危害我国居民生命健康的主要杀手。应用中医药治疗恶性肿瘤已成为公认的综合治疗方法之一,且中医药治疗乳腺癌有着广泛的适应证和独特的优势。从整体出发,调整机体气血、阴阳、脏腑功能的平衡,根据不同的临床证候进行辨证论治。确定“先证而治”的方向:即后续证侯尚未出现之前,需要截断恶化病情的哪些后续证侯。发现中医症状间的关联关系和诸多症状间的规律性,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。这样,在治疗患者的过程中,医生可以有效地减少西医治疗的毒副作用,
原创
发布博客 2020.09.12 ·
3557 阅读 ·
2 点赞 ·
0 评论 ·
36 收藏

python数据分析与挖掘实战---chapter7航空公司客户价值分析

1. 背景与挖掘目标1.1 背景企业营销焦点从产品中心转变为客户中心,客户关系管理成为企业的核心问题客户关系管理的关键问题是客户分类,通过客户分类,针对不同价值的客户制定优化的个性化服务方案,采取不同营销策略1.2 目标借助航空公司客户数据,对客户进行分类。对不同的客户类别进行特征分析,比较不同类客户的客户价值。对不同价值的客户类别提供个性化服务,制定相应的营销策略。2. 分析方法与过程本案例的目标是客户价值识别。识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔(R
原创
发布博客 2020.09.11 ·
3477 阅读 ·
5 点赞 ·
2 评论 ·
27 收藏

python数据分析与挖掘实战---5.1.4 决策树:ID3算法

ID3算法简介及基本原理ID3算法基于信息嫡来选择最佳测试属性。它选择当前样本集中具有最大信息增益值的属性作为测试属性;样本集的划分则依据测试属性的取值进行,测试属性有多少不同取值就将样本集划分为多少子样本集,同时决策树上相应于该样本集的节点长出新的叶子节点。ID3算法根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性:信息增益值越大,不确定性越小。因此,ID3算法在每个非叶节点选择信息增益最大的属性作为测试属性,这样可以得到当前情况下最纯的拆分,从而得到较小的决策
原创
发布博客 2020.09.09 ·
1818 阅读 ·
2 点赞 ·
0 评论 ·
14 收藏

python数据分析与挖掘实战---拉格朗日插值法

拉格朗日插值法定义对某个多项式函数,已知有给定的k + 1个取值点:其中Xj对应着自变量的位置,而Yj对应着函数在这个位置的取值。假设任意两个不同的xj都互不相同,那么应用拉格朗日插值公式所得到的拉格朗日插值多项式为:其中每个为拉格朗日基本多项式(或称插值基函数),其表达式为:拉格朗日基本多项式的特点是在Xj上取值为1,在其它的点Xi,i≠j上取值为0。范例假设有某个二次多项式函数{\displaystyle f}f,已知它在三个点上的取值为:要求 f(18) 的值。首先
原创
发布博客 2020.09.09 ·
1370 阅读 ·
3 点赞 ·
0 评论 ·
10 收藏

CD用户消费数据分析

项目来自网络附数据集1.数据载入和探索1.1 数据加载import numpy as npimport pandas as pd%matplotlib inlineimport matplotlib.pyplot as pltdf = pd.read_csv('./CDNOW_master.csv', names = ['user_id', 'order_dt', 'order_products', 'order_amount'], sep='\s+')df.head()use
原创
发布博客 2020.09.08 ·
946 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

奥运会数据集分析

项目来自和鲸社区奥运会数据集分析目录项目来自和鲸社区[奥运会数据集分析](https://www.kesci.com/home/project/5b6912bc9889570010c244f3)1. 数据载入与总览1.1 数据加载1.2 数据总览2. 奥运会运动项目词云3. 查看参赛者的男女基本信息3.1. 120年来参赛者的男女比例3.2. 查看参赛者的男性与女性的年龄分布3.3. 查看1896-2014年男女参赛者的平均年龄变化3.4. 查看120年来????夏季????奥运会获奖运动员不同性别的平均
原创
发布博客 2020.09.08 ·
6865 阅读 ·
3 点赞 ·
2 评论 ·
60 收藏