Python 数据分析第一期
一. 工作环境准备及数据分析建模理论基础
1.使用Python环境
主要包括:
anconda环境
python的IDE–Pycharm
2.数据分析思路过程
3.Anaconda
Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。
Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等
Miniconda包括Conda、Python
conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换
4.案例代码
本项目代码为“科技工作者的心理健康数据分析”,其中数据集可从
https://www.kaggle.com/osmi/mental-health-in-tech-survey
如下地址获取。此过程原理为简单的从csv里取出数据,然后进行请理之后在分析完成生成另一个csv文件。
# -*- coding: utf-8 -*-
"""
项目名称:科技工作者心理健康数据分析 (Mental Health in Tech Survey)
"""
import csv
# 数据集路径
data_path = './survey.csv' #数据集存放目录
def run_main():
"""
主函数
"""
male_set = {
'male', 'm'