数据科学
文章平均质量分 58
Kukafee
好好工作、好好生活、好好旅游。
展开
-
数据分层简述
以下内容摘抄自:最详细!深入浅出理解「3层6类」数据分层 | 人人都是产品经理【侵权即删!!! 】数据是通过观测得到的信息,是对客观物质世界的记录。数据建模是对客观物质世界的抽象,用数据来表征这个客观物质世界。数据分层是把数据以合理的方式表现,提高效率。数据分层的目的不外乎:降低存储成本、提高使用效率、保障数据质量。数据分层的设计思想,促使了数据仓库的诞生。数据仓库(DW 即Data Warehouse)大师曾定义,数据仓库是一个面向主题的(Subject Oriente..原创 2021-10-29 11:31:07 · 4725 阅读 · 0 评论 -
关于map的一些用法总结
1.data = [{"a": 1, "b": 2, "c": 3}, {"a": 11, "b": 22, "c": 33}, {"a": 111, "b": 222, "c": 333}]df = pd.DataFrame(data)dfdf['stat'] = df['a'].map(lambda x: 'big' if x > 100 else 'small')df2.def func(i): return ...原创 2021-10-11 19:25:02 · 238 阅读 · 0 评论 -
数据分析:方法+工具
如下摘自:https://bbs.pinggu.org/thread-10402077-1-1.html方法 完整的数据分析流程一般如下图工具原创 2021-01-31 16:32:03 · 472 阅读 · 0 评论 -
R语言学习与总结
1. 数据变量类型连续型变量 -- 可以呈现为某个范围内的任意值,并同时表示了顺序和数量 有序型变量 -- 表示顺序关系的变量,而非数量关系 名义型变量 -- 没有顺序之分的类别变量 在R中,类别(名义型)变量 和 有序类别(有序型)变量成为因子2. 数据类型(模式)数值型 -- "numeric" 字符型 -- "character" 逻辑型 (TRUE/FALSE) -- "" 复数型(虚数) -- "" 原生型(字节) -- ""3.数据结构标量 -...原创 2021-01-29 22:13:41 · 1105 阅读 · 0 评论 -
Python之数据分析
利用Python进行数据分析注:本文许多内容来自互联网,如有侵权,请告知。目录利用Python进行数据分析pandas NumPy IpythonJupytermatplotlibStatsmodelsScikit-learn 数据分析程序集CLRpandas pandas基于NumPy 的一种工具,该工具是为了解决...原创 2019-01-04 20:30:47 · 5495 阅读 · 1 评论 -
PCA、AutoEncoders 、VAE、GAN
PCA摘自原文:https://blog.csdn.net/program_developer/article/details/80632779 相关背景:对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量数据集增加了数据采集的工作量。在很多情形下,许多变量之间可能存在相关性,增加了问题分析的复杂性。如果分别对每个指标进行分析,分析往往是孤立的,不能完...原创 2019-06-26 10:50:03 · 1139 阅读 · 0 评论 -
统计学习方法——朴素贝叶斯
使用sklearn数据包进行数据分析,sklearn.datasets 是sklearn自带的模块,提供了一些导入、在线下载及本地生成数据集的方法: load_<dataset_name> 本地加载数据,如: Iris = datasets.load_iris #鸢尾花数据集 fetch_<dataset_name> 远程加载数据 make_<...原创 2019-05-21 11:12:37 · 331 阅读 · 0 评论