![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学库
文章平均质量分 81
桑之未落0208
努力学习数据挖掘的大学生
展开
-
Chapter 6 pandas中的时间序列
时间序列的创建start——创建时间序列的起始时间end——创建时间序列的结束时间freq——创建时间间隔依据 D天 M月 ,若每隔三天可以使用3D。periods——创建时间序列个数In [1]: import pandas as pdIn [2]: pd.date_range(start='20171230',end='20180131',freq='D')Out[2]:DatetimeIndex(['2017-12-30', '2017-12-31', '2018-01-01',原创 2022-05-11 20:35:44 · 261 阅读 · 0 评论 -
Chapter5 数据的合并和分组聚合
字符串离散化的案例#coding=utf-8import matplotlib.pyplot as pltimport pandas as pdimport numpy as npfile_path='IMDB-Movie-Data.csv'df=pd.read_csv(file_path)#统计分类的列表temp_list=df['Genre'].str.split(',').tolist() #[[],[],[]]genre_list=list(set([i for j in tem原创 2022-05-09 18:09:41 · 399 阅读 · 0 评论 -
chapter4 pandas处理数据
学习pandas的原因(1)借助pandas可以处理非数值型数据,例如,字符串、时间序列等。(2)可以处理数值(3)高性能、易用的数据结构、数据分析工具pandas常见的数据类型(1)Series一维,带标签的数组(2)DataFrame二维,Series容器In [1]: import pandas as pdIn [2]: pd.Series([1,2,31,12,3,4])Out[2]:0 11 22 313 124 35 4原创 2022-05-08 12:43:36 · 598 阅读 · 0 评论 -
Chapter3 numpy创建数组
numpy学习学习numpy的原因快速、方便、科学计算的科学库什么是numpy一个在python中做科学计算的基础库,重在数值计算,也是大部分python科学计算库的基础库,多用在大型、多维数组上执行数组运算。numpy创建数组(矩阵)一共有三种创建的方法,如下。#coding=utf-8import randomimport numpy as np#创建方法一t1=np.array([1,2,3,])print(t1)print(type(t1))#创建方法二t2=np.a原创 2022-05-03 23:23:49 · 940 阅读 · 0 评论 -
Chapter 2数据分析
matplotlib绘制散点图使用scatter方法设置散点图,与之前绘制折线图见Chapter1数据分析的唯一区别。#coding=utf-8from matplotlib import pyplot as plty_3=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]y_10=[26,26,28,19,21,17,16,19,18,20,20,19,22,23,1原创 2022-04-30 22:50:18 · 288 阅读 · 0 评论 -
Chapter1数据分析
一.数据分析的介绍1.学习数据分析的原因(1).岗位需求(2).python数据科学的基础(3).机器学习课程的基础2.数据分析的定义数据分析是用适当的方法对收集的大量数据进行分析,帮助人们作出判断,以便采取适当的行动。3.数据分析的流程提出问题准备数据(数据清洗)分析数据获得结论(成果可视化)二.jupyter和conda的使用1.conda环境安装创建环境:conda create切换环境:windows:activate python3 ...原创 2022-04-29 11:43:26 · 613 阅读 · 0 评论