书摘
gulie8
这个作者很懒,什么都没留下…
展开
-
《数据化运营管理》
数据化运营管理张茹 黄苑 段星梅1.1 数据化运营概述数据化运营始终以增加新用户(拉新)、留住老用户(留存)和提升用户活跃度(促活)为目标。实际上,留住老用户的难度比增加新用户的难度更高。要想留住老用户,产品质量、价格、用户体验、会员管理等都是需要实施数据化运营手段的重要环节。在每次卖出时都向来购买的同学询问,他们是在哪里得知自己在售卖饮料的消息的。一个月后,姜晓结合销售额与前期搜集到的同学们的回答,推断出购买饮料的同学大部分来自于学校食堂和学校操场。原创 2021-06-25 16:22:09 · 992 阅读 · 0 评论 -
轻松学统计--中国mooc11
一元回归分析:回归分析是个概率模型原创 2019-12-03 17:14:30 · 154 阅读 · 0 评论 -
轻松学统计--中国mooc10
Project descriptionitchat is a open souce wechat api project for personal account.It enables you to access your personal wechat account through command line.相关与回归分析:两变量相关分析一、相关表与相关图(一)相关...原创 2019-12-03 16:58:04 · 996 阅读 · 0 评论 -
轻松学统计--中国mooc9
样本容量的确定:一、总体均值估计时样本容量的确定二、总体比例估计时样本容量的确定样本容量的影响因素:(1)极限误差;(2)总体方差;(3)置信水平;(4)抽样组织形式;(5)抽样方法。一、总体均值估计时样本容量的确定二、总体比例估计时样本容量的确定假设检验:什么是假设?在参数检验中,对总体参数的具体数值...原创 2019-12-03 12:00:22 · 699 阅读 · 0 评论 -
轻松学统计--中国mooc8
区间估计的基本原理:点估计的缺点:不能反映估计的误差和精确程度区间估计:利用样本统计量和抽样分布估计总体参数的可能区间(1934年,由统计学家J.奈曼所创立的一种严格的区间估计理论。)【例】Traveller公司是一家专门生产旅行箱包的公司,为了监控公司的产品质量,Traveller公司每月都要随机抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在12分左...原创 2019-12-02 17:33:19 · 2327 阅读 · 0 评论 -
轻松学统计--中国mooc7
参数估计:引言上一章,我们介绍了总体、样本、简单随机样本、统计量和抽样分布等概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理。它们是进一步学习统计推断的基础。一、估计量与估计值参数估计:利用样本的信息去估计总体的参数或参数的函数,如平均降水量、箱包的合格率等;估计量:用来估计总体参数的统计量的名称;二、点估计点估计:用样本估计值直接作为总体的未知参数...原创 2019-12-02 16:36:33 · 587 阅读 · 0 评论 -
轻松学统计--中国mooc6
抽样与抽样分布:•为什么要抽样?–总体中元素较多时,对所有元素进行逐一观测往往很不现实,费时费力不及时–要想知道梨子的味道就要亲口尝一尝–你不必吃完整一头牛,才知道它的肉是咬不动的–某种抽样有破坏性,如炮弹、灯管等•样本和总体•重置抽样和不重置抽样•概率抽样和非概率抽样•简单随机抽样(simple random sampling)–从总体N个单位中随机地抽取n个单位作为样...原创 2019-12-02 15:50:02 · 592 阅读 · 0 评论 -
轻松学统计--中国mooc5
离散指标(二):反映离散程度的相对指标一、离散系数(相对离中趋势)1.离散系数的定义:从相对数角度来反映数据的离散程度。2.离散系数的特点:A.可用于两个总体平均水平不同时;B.可用于两个总体性质不同或计量单位不同时。3.分类标准差系数(很多时候直接称其为离散系数):一组数据的标准差与其对应的平均数之比平均差系数:一组数据的平均差与其对应的平均数之比四分位差系数:一组数据的...原创 2019-11-29 15:44:06 · 1712 阅读 · 0 评论 -
轻松学统计--中国mooc4
位置平均数:集中趋势之稳健表达一、中位数1.定义:将变量值按大小次序排列,处于中间位置的变量值即为中位数-Me[例]某科室由9人组成,其年龄分别为:24,25,25,26,26,27,28,29,552.计算(1)当资料未分组时,中点位置=(n+1)/2;当n为奇数时, Me =中间位置的那个变量值;当n为偶数时, Me =中间位置两侧的两个变量值的简单平均。3.注意的问题...原创 2019-11-28 18:00:40 · 916 阅读 · 0 评论 -
轻松学统计--中国mooc3
计算平均数(1):集中趋势之充分表达计算平均数(一):算术平均数一、平均指标的概念与种类1.平均指标的定义:反映同类现象一般水平的统计指标。2.特点(1)将各单位的数量差异抽象化,即消除离差;(2)反映次数分布的集中趋势,即找出中心;(3)是总体各单位某一数量标志值的代表水平。二、算术平均数1. 基本公式=总体标志总量/总体单位总量注意:在计算算术平均数时,分...原创 2019-11-27 17:44:12 · 1550 阅读 · 0 评论 -
轻松学统计--中国mooc2
频数分布:初显总体分布特征统计资料通过统计分组后就形成统计数列。一、统计数列分类1.按品质标志分组形成品质数列。2.按数量标志分析形成变量数列。二、变量数列分类和构成1.变量数列的分类(1)单项式数列:用一个变量值表示一个组的数列。通常只适用于离散变量,且在变量值较少的情况下使用。这种分组在实际中应用的较少。(2)组距式数列:用一个区间表示一个组的数列,实际中使用较多。...原创 2019-11-27 17:22:22 · 1989 阅读 · 1 评论 -
轻松学统计--中国mooc1
统计学的研究方法:(一)大量观察法:对事物的全部或足够数量进行观察的方法。(二)统计描述法统计描述法是指通过了解客观实际,并对搜集到的数据进行加工整理和综合分析,得到各种能够反映总体数量特征的综合指标,以此反映现象总体的总量规模、结构比例、速度快慢等实际状况。统计分组法综合指标法统计模型法(三)统计推断法1、演绎推断:一般(总体)个别(个体)。[例]甲班同学的身高<1...原创 2019-11-27 16:40:22 · 1708 阅读 · 0 评论 -
Python编程基础(中国mooc)7
os模块的使用--基础操作:通过os模块可以方便地使用操作系统的相关功能。使用os模块的功能前,需要先通过“import os”将其导入。查看系统平台:使用“os.name”可以查看当前操作系统的名字,Windows用字符串“nt”表示,Linux用字符串“posix”表示。获取当前系统平台路径分隔符:不同操作系统可能会使用不同的路径分隔符。例如,windows系统以“\\”...原创 2019-11-22 14:35:43 · 1438 阅读 · 1 评论 -
Python编程基础(中国mooc)6---正则表达式
正则表达式的基础语法:通过正则表达式可以定义一些匹配规则,只要满足匹配规则即认为匹配成功,从而实现模糊匹配。正则表达式中既可以包含普通字符,也可以包含由特殊字符指定的匹配模式。在实际应用正则表达式进行匹配时,正则表达式中的普通字符需要做精确匹配,而特殊字符指定的匹配模式则对应了用于模糊匹配的规则。由于Python的字符串中使用“\”作为转义符,如果要在字符串中使用...原创 2019-11-21 10:59:21 · 439 阅读 · 0 评论 -
Python编程基础(中国mooc)5
字符串比较规则:两个字符串按照从左至右的顺序逐个字符比较,如果对应的两个字符相同,则继续比较下一个字符。如果找到了两个不同的字符,则具有较大ASCII码的字符对应的字符串具有更大的值。如果对应字符都相同且两个字符串长度相同,则这两个字符串相等。如果对应字符都相同但两个字符串长度不同,则较长的字符串具有更大的值。字符串切割:split方法:使用字符串中的spli...原创 2019-11-20 14:46:19 · 2275 阅读 · 0 评论 -
Python编程基础(中国mooc)4
列表元素排序:使用列表中的sort方法可以对列表中的元素按照指定规则进行排序,sort方法的语法格式如下:ls.sort(key=None,reverse=False)其中,key接收一个函数,通过该函数获取用于排序时比较大小的数据;reverse指定是将列表中的元素按升序(False,默认值)还是按降序(True)排列。#对一个元素是字符串的列表,按长度从大到小排序:lst1=[...原创 2019-11-19 14:25:32 · 481 阅读 · 0 评论 -
Python编程基础(中国mooc)3
动态扩展类与实例:Python作为一种动态语言,除了可以在定义类时定义属性和方法外,还可以动态地为已经创建的对象绑定新的属性和方法。在给对象绑定方法时,需要使用types模块中的MethodType方法,其第一个参数是要绑定的函数名,第二个参数是绑定的对象名。给一个对象绑定方法后,只能通过该对象调用该方法,其他未绑定该方法的对象则不能调用。例如,没有为stu2对象绑定SetN...原创 2019-11-18 15:56:21 · 1287 阅读 · 0 评论 -
Python编程基础(中国mooc)2
全局变量__name__:每个模块中都有的一个全部变量__name__.__name__的作用是获取当前模块的名称,如果当前模块是单独执行的,则其__name__的值就是__main__;否则,如果是作为模块导入,则其__name__的值就是模块的名字。包:Python中的包(Package)的作用与操作系统中文件夹的作用相似,利用包可以将多个关系密切的模块组成在一起,一方...原创 2019-11-15 15:24:17 · 1522 阅读 · 1 评论 -
Python编程基础(中国mooc)1
指令和程序:每台计算机都有自己的指令( Instruction Instruction Instruction Instruction )集合,每条指令可以让计算机完成 一个最基本的操作。程序( Program Program )则是由一系列指令根据特定规组合而成,在计算机上执行程序的过程实质上就是组成程序的各条指令按顺序依次执行的过程。使用Python 3.x环境创建Python脚本文...原创 2019-11-13 14:18:49 · 1613 阅读 · 1 评论 -
Python机器学习应用(中国mooc)-摘2
K-means聚类算法:k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。其处理过程如下:1.随机选择k个点作为初始的聚类中心;2.对于剩下的点,根据其与聚类中心的距离,将其归入最近的簇。3.对每个簇,计算所有点的均值作为新的聚类中心。4.重复2、3直到聚类中心不再发生改变。K-means 的应用:数据介绍:现有 19...原创 2019-11-05 13:21:07 · 438 阅读 · 0 评论 -
Python机器学习应用(中国mooc)-摘1
机器学习的目标:机器学习是实现人工智能的手段,其主要研究内容如何利用数据或经 验进行学习,改善具体算法的性能• 多领域交叉,涉及概率论、统计学算法复杂度理等门科• 广泛应用于 网络搜索、垃圾邮件过滤 、推荐 系统、广告投放信用 评价 、 欺诈检测、股票交易 和医疗诊断等 应用机器学习分类:机器学习一般分为下面几种类别• 监督学习 (Supervised Learning S...原创 2019-11-01 16:19:07 · 447 阅读 · 0 评论 -
高级语言程序设计(python)摘
高级语言程序设计(python)摘什么是程序?v 程序(Program)n 流程、议程、行程、…n 为了完成某项任务,解决某个问题所需要执行的一系列步骤v 计算机程序n 为了完成某项任务,解决某个问题由计算机执行的一系列指令(步骤)什么是计算机?v 计算机(Computer)n 能够按照程序自动运行的机器组成:硬件(Hardware)n 计算机的躯壳...原创 2019-10-31 17:32:07 · 446 阅读 · 0 评论 -
商务营运数据分析(中国mooc)
数据分析的作用:现状分析、原因分析、预测分析。数据分析的流程:明确数据分析目的、梳理数据分析思路(重中之重)、数据收集、数据处理、数据分析、数据呈现。营销活动方案通常会采用"4P"营销组合策略:产品、价格、渠道、促销;可能是:产品线不够长,产品缺乏吸引力;价格偏高,顾客不能接受;引流渠道不够精准,客户质量偏低;促销力度不大,或者满减条件过高。数...原创 2019-11-10 19:02:48 · 3283 阅读 · 0 评论 -
对比Excel,轻松学习Python数据分析--摘
数据分析在企业日常经营分析中有三大作用,即现状分析、原因分析、预测分析。1.2.1 现状分析现状分析可以告诉你业务在过去发生了什么,具体体现在两个方面。第一,告诉你现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。第二,告诉你企业各项业务的构成,通常公司的业务并不是单一的,而是由很多分支业务构成的,通过现状分析可以让你了解企业各项分支业务...原创 2019-09-05 10:57:44 · 1402 阅读 · 1 评论 -
PYTHON数据分析与挖掘实战-摘
集合:python内置了集合这一数据结构,同数学上的集合概念基本上是一致的,它与列表的区别在于:1.它的元素是不重复的,而且是无序的;2.它不支持索引。一般我们通过花括号{}或者set()函数来创建一个集合。>>alstOut[2]: [2, 3, 45, 5, 3, 3, 2]>>set(alst)Out[3]: {2, 3, 5, 45}由于集合的特殊性(...原创 2019-08-21 21:59:56 · 250 阅读 · 0 评论 -
《趣学python》摘
查看dataframe各列缺失值个数的方法:法一:def missingva(x): return sum(x.isnull())df.apply(missingva,axis=0)Out[39]:序号 0Root Id 0客户名称 0客户类型 0...单数(拆分) 0业绩...原创 2019-08-19 21:25:18 · 150 阅读 · 2 评论