python数据分析新手入门课程学习——(一)数据获取(来源:慕课网)

本文是Python数据分析新手入门课程的第一部分,主要介绍了数据分析的基本流程、目标及常用工具,包括Python库如NumPy、SciPy、matplotlib和pandas。接着详细讲解了数据获取的四种方式:数据仓库、监测与抓取、填写与日志、埋点,并提到了Python中用于抓取和解析数据的相关库。最后,提到了数据学习资源网站。
摘要由CSDN通过智能技术生成

一,流程 

                        

二,数据分析概述

 含义与目标:使用统计分析方法,在数据中提取有用的信息并进行总结与概括的过程。

三,使用工具

蟒蛇语言以及numpy的,SciPy的,matplotlib,scikit学习,熊猫等工具包

注意:学习过程中要勤于查阅


 

A、数据获取手段

1.数据仓库(DW):将所有业务数据经汇总处理构成

            1)特点:

             全部事实的记录;部分维度与数据的整理

            2)数据库与数据仓库的不同

            ++数据库面向业务存储,仓库面向主题存储(主题:对于购买图书这一行为就可看作是个主题。谁在几分几秒以什么价格购买了什么书就是购买主题的一个记录。)

            ++数据库针对应用(OLTP),仓库针对分析(OLAP)

            ++数据库组织规范,仓库可能冗余,相对变化大,数据量大

2.监测与抓取

监测:使用检测设备或算法直接获

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值