python数据分析与数据化运营
凝聚才华
种一棵树最好的时间是十年前,其次是现在。
很喜欢“毛竹”:毛竹4年也只不过长3厘米,5年后以每天足足30厘米的速度生长着。这样只用6周就可以长到15米
展开
-
小白学(Python数据分析与数据运营)的日常杂记7
代码实操:Python数据清洗1 缺失值处理2 异常值处理3 重复值处理1 缺失值处理1-1. 对于缺失值的处理,主要配合使用sklearn.preprocessing中的Imputer类、Pandas和Numpy。其中由于Pandas对于数据探索、分析和探查的支持较为良好,因此围绕Pandas的缺失值处理较为常用。import pandas as pd #导入Pandas库import ...翻译 2019-07-15 11:29:57 · 176 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记10
数据化运营要抽样还是全量数据翻译 2019-07-17 14:55:24 · 283 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记14
离散化,对运营数据做逻辑分层离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:原数据:1,999,100000,15;处理后:1,3,4,2;原数据:{100,200},{20,50000},{1,400};处理后:{3,4},{2,6},{1,5};翻译 2019-07-19 17:14:55 · 148 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记16(聚类分析)
聚类分析1. 当心数据异常对聚类结果的影响1.1 数据的异常值1.2 数据的异常量纲2. 超大数据量时应该放弃K均值算法3. 聚类不仅是建模的终点,更是重要的中间预处理过程3.1 图像压缩3.2 图像分割3.3 图像理解3.4 异常检测3.5 数据离散化4. 高维数据上无法应用聚类吗?5. 如何选择聚类分析算法6. 代码实操:Python聚类分析聚类是数据挖掘和计算的基本任务,是将大量数据集中具...翻译 2019-07-23 20:51:40 · 843 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记6
1. 读取图像数据1.1 Python读取图像通常使用PIL和OpenCV两个库1.1.1使用PIL读取图像Python Imaging Library中包含很多库,常用的是其中的Image,通过使用其中的open方法来读取图像,用法如下:代码如下from PIL import Image #导入库 file = 'cat.jpg' #定义图片地址 image = Ima...翻译 2019-07-12 16:49:08 · 274 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记9
解决样本类别分布不均衡的问题翻译 2019-07-16 17:24:19 · 230 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记5
2.使用load方法读取数据文件import numpy as np # 导入nump库 write_data = np.array([[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]])# 定义要存储的数据 np.save('load_data', write_data) # 保存为npy数据文件 read_data = np.load('load_d...翻译 2019-07-12 13:48:01 · 289 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记4
数据化运营的数据来源1. 从数据结构类型上来讲,包括结构化和非结构化数据;从数据来源方式来分,既有导出的数据文件、数据库等常见来源,又有流式、API等复杂系统接口和外部资源数据。2.数据化运营的数据来源类型:数据文件、数据库、API、流式数据、外部公开数据和其他来源等。数据文件:存储数据的文件,广义上,任何文件中存储的信息都可以称为数据;狭义上,数据文件中以数字或文本形式存储的结构化的...原创 2019-07-12 11:55:33 · 295 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记13
标准化,让运营数据落入相同的范围翻译 2019-07-18 16:27:15 · 205 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记12
有关相关性分析的混沌翻译 2019-07-18 15:40:14 · 147 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记9
大数据时代的数据降维;数据降维就是降低数据的维度数量,数据降维是维数归约的一个重要课题。翻译 2019-07-16 11:26:19 · 396 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记3
案例数据可以访问录下链接下载:链接:https://pan.baidu.com/s/1fvdFMz9WwTXOKn_fL4AXyA提取码:huhu复制这段内容后打开百度网盘手机App,操作更方便哦第一个用Python实现的数据化运营分析实例——销售预测1 案例场景:每个销售型公司都有一定的促销费用,促销费用可以带来销售量的显著提升;当给出一定的促销费用时,预计会带来多大的商品销...翻译 2019-07-11 17:46:21 · 787 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记2
数据化运营所需的Python相关工具和组件1.Python程序Python仍然是两个系列的版本并存Python 2和Python 3这两个版本的语法不完全兼容2.Python IDE工具——PyCharm。3.Python第三方库——交互开发库、科学计算库、机器学习库、自然语言库、数据库连接库、图像处理库、网络爬虫库、图像展示库等交互开发库——IPython 科学计算库——...翻译 2019-07-11 14:56:38 · 272 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记1
Python数据分析与数据运营 (宋天龙 著)(仅供学习,提取码:cm5q)1.Python是一种面向对象的解释型计算机程序设计语言,作者:荷兰人荷兰人:吉多·范罗苏姆(Guido van Rossum),发明时间:1989年 (那一年,我1岁都还不到啊啊啊啊!)2.为什么要选择Python而非其他语言(例如R)进行数据处理、分析和挖掘?(下面是对python表忠心的时候了)...翻译 2019-07-11 11:39:32 · 798 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记8
将分类数据和顺序数据转换为标志变量翻译 2019-07-15 14:54:19 · 169 阅读 · 0 评论 -
小白学(Python数据分析与数据运营)的日常杂记15
代码实操:Python数据离散化处理翻译 2019-07-23 11:27:43 · 124 阅读 · 0 评论