自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 numpy task 02

副本与视图在numpy中,尤其是在做数组运算或数组操作时,返回结果不是数组的副本就是视图在numpy中,所有复制运算不会为数组和数组中的任何元素创建副本numpy.ndarray.copy()函数创建一个副本。对副本进行修改,不会影响到原始数据,物理内存不在同一位置。import numpy as np x = np.array([1, 2, 3, 4, 5, 6, 7, 8])y = xy[0] = -1print(x)# [-1 2 3 4 5 6 7 8]print

2020-10-23 18:01:22 96

原创 Numpy task01

ndarray大数据容器执行数学运算容器内所有的元素必须是相同类型的构成: 一个shape(一个表示各维度大小的原件)和 dtype(一个用于说明数组数据类型的对象)创建ndarry

2020-10-20 20:24:57 230

原创 数据清理、转换、合并、重塑

dataframe合并# - merge 默认做的是inner链接,取得数据之间的交集df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})df2 = DataFrame({'key': ['a', 'b', 'd'], 'data2': range(3)})df1 key data10 b 01 b 12 a 23 c 34 a 45 a 56 b 6df2 ke

2020-09-10 16:56:29 374

原创 复习数据分析task01 pandas入门

pandasseriesdataframe##Series3. 由一组数据和一组与之相关的数据标签(即索引)组成obj = Series([4, 5, -5, 3])obj0 41 72 -53 3#表现形式极为索引在左,值在右边#如果需要表现获取数组表现形式和索引对象#用values获取数值obj.valuesorray([4, 7, -5, 3])#用index获取索引对象obj.indexInt64Index([0, 1, 2, 3])#series对每

2020-09-02 17:18:08 286

原创 数据分析建模和评估

# sklearn模型算法选择路径图Image('sklearn.png')'''任务一:切割训练集和测试集这里使用留出法划分数据集将数据集分为自变量和因变量按比例切割训练集和测试集(一般测试集的比例有30%、25%、20%、15%和10%)使用分层抽样设置随机种子以便结果能复现'''from sklearn.model_selection import train_test_splitX = datay = train['Survived']X_train, X_test,

2020-08-28 20:34:09 358

原创 数据可视化

#引入约定import matplotlib.pyplot as plt#matplotlib 图像保存在figure对象里#创建新的figurefig = plt.figure()#其中figsize用于确保图片保存时的纵横比#绘图需要创建一个或多个 subplotaxi = fig.add_subplot(2, 2, 1)axi = fig.add_subplot(2, 2, 2)axi = fig.add_subplot(2, 2, 3)#代码意思图像是2*2 大小,选中的是第

2020-08-26 10:40:43 118

原创 数据重组

1.groupby机制第一步,数据包含在pandas对象中,可以是Series、DataFrame或其他数据结构第二步,根据你提供的一个或多个键分离到各个组中注:分离操作是在数据对象的特定轴向上进行的。第三步,函数就应用到各个组中,产生新的值第四步,所有函数的应用结果联合为一个结果对象2.分组键可是多种形式,并且键不一定是完全相同的类型(1)与需要分组的轴向长度一致的值列表或值数组(2) DataFrame的列名的值(3)可以将分组轴向上的值和分组名称相匹配的字典或Series(4) 可

2020-08-23 22:25:00 2209

原创 数据清洗

第二章第一节数据清洗第一部分数据处理第二部分 特征观察与处理

2020-08-21 22:39:17 149

原创 数据分析task1

数据加载1.1 导入numpy和pandasimport numpy as npimport pandas as pd1.2 载入数据#使用相对路径载入数据-相对路径就是以当前文件为基准进行一级级目录指向被引用的资源文件df = pd.read_csv('train.csv')#使用绝对路径载入数据-绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件。df = pd.read_csv('D:\学习\动手学数据分析-组队学习版\第一单元项目集合/tr.

2020-08-19 22:05:44 191

原创 task 04

#将以数指定年,月,日的日期打印出来months = [ 'January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'Novemer', 'December' ] #一个列表,其中包含数1-31对应的结尾 endings = ['st', 'nd',

2020-07-28 23:42:47 85

原创 task03异常处理

task03异常处理try/expectwhile True: try: x = int(input("请输入一个数字: ")) break except ValueError: print("您输入的不是数字,请再次尝试输入!") ''' try 语句按照如下方式工作首先,执行 try 子句(在关键字 try 和关键字 except 之间的语句)。如果没有异常发生,忽略 except 子句,try 子句执行后结束。

2020-07-25 21:56:13 131

原创 task02 条件循环结构

task 02: 条件循环结构1.掌握基本的条件,循环语句的使用2.掌握assert断言break,continue,pass,等语句的使用3.熟悉推导式的用法引入# Fibonacci series: 斐波纳契数列# 两个元素的总和确定了下一个数a, b = 0, 1while b < 10: print(b) a, b = b, a+b 112358'''第一行包含了一个复合赋值:变量 a 和 b 同时得到新值 0 和 1。最后一行再次使用了

2020-07-23 22:17:11 160

原创 Task01: 变量、运算符、数据类型及位运算

1.1 Task01: 变量、运算符、数据类型及位运算理论部分:1. 了解变量类型,运算符,数据类型2. 了解位运算1.1 task01:变量、运算符、数据类型以及位运算1基本语法1.1注释1.1.1单行 #开头1.1.2多行注释 ‘’’ ‘’’ 或者“”” ”””1.2行与缩进1.2.1 缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数(坚持使用4个空格的缩进)1.3 多行语句Eg:total = [‘item_one’, ‘item_two’,

2020-07-22 23:43:03 160

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除