自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 JAVA语言概述和基本语法

JAVA语言概述 1.JAVA语言的特点 1.面向对象性 两个要素:类, 对象 三个特征:封装, 继承, 多态 2.健壮性 (1)去掉了C语言中的指针’(2)自动垃圾回收机制,但仍然会出现内存溢出和内存泄漏; 3.跨平台性 一次编译,到处运行(write once run anywhere) 功劳归功于JVM(虚拟机) 2.开发环境搭建 JDK = JRE +开发工具集(例如javac等) JRE = JVM +JAVA SE标准类库 3.注释(comment) 分类: 单行注释: // 多行注释:/*

2021-03-10 17:34:26 157

原创 数据规整:聚合、合并和重塑

在许多应⽤中,数据可能分散在许多⽂件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的⽅法。 8.1层次化索引 data = pd.Series(np.random.randn(9), ...: index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'], ...: [1, 2, 3, 1, 3, 1, 2, 2, 3]]) data data['b'] #得到参数是b的数 data['b':'c'] #得到参数是b和c

2020-07-26 21:51:00 239

原创 数据清洗和准备

处理缺失数据 string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado']) string_data string_data.isnull() #判断每个值是不是缺失值 string_data[0] = None string_data.isnull() 滤除缺失数据 from numpy import nan as NA data = pd.Series([1, NA, 3.5, NA, 7]) data.dropna()

2020-07-25 00:32:50 151

原创 数据加载、存储与文件格式

读写文本格式的数据 !cat examples/ex1.csv #逗号分隔的文本文件 df = pd.read_csv('examples/ex1.csv') #读取该文件,生成一个DataFrame df pd.read_table('examples/ex1.csv', sep=',') #读取文件并选择逗号为分隔符 #以上为有标题行,而对于没有标题行的文件有两种方法 pd.read_csv('examples/ex2.csv', header=None) #得到的DataF

2020-07-21 23:08:12 421 1

原创 面向对象编程和类

一个简单的OOP的例子 class Product: def _init_(self,name): self.name=name self.label_price=0 self.real_price=0 c=Product("电脑") d=Product("打印机") e=Product("投影仪") c.label_price, c.real_price= 10000,8000 d.label_price, d.real_price

2020-07-21 09:26:28 76

原创 pandas入门

#panda的数据结构 ##Series series的字符串表现形式和字典差不多,有索引和值(类似于键值对),当不给索引的参数时默认索引是0,1,2、、、N-1 obj = pd.Series([4,7,-5,3]) obj.values #输出是:array([4,7,-5,3]) 下例是给予索引参数: obj2 = pd.Series([4,7,-5,3],['d','b','a','c']) 索引 obj2['a'] 改value obj2['c']=6 筛选值 obj2[obj2>0

2020-07-20 18:37:32 179

原创 字符串切片

#字符串切片 字符串切片一般有两种方法:split()和re.split() ##split()法 >>>str = 'line1-abcdefg \nline2-abc \nline4-abcd' >>>str.split() ['line1-abcdefg', 'line2-abc', 'line4-abcd'] ##re.split() 法 适用于多个分隔符或者是分隔符周围空格不确定的情形 >>> line = 'asdf fjdk; afed;

2020-06-28 15:08:57 488

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除