自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 R语言中循环、图形 10-17周六

for:for(i in 1:10) print('hello')i<-10while (i>0) {print('hello');i<-i-1} ifelse (score>0.5,print('passed'),print('Failed)options(digits=3)attach(mtcars)aggdata<-aggregate(mtcars,by=list(cyl,gear),Fun=mean,na.rm=TRUE) #基本条形图

2020-10-17 16:40:45 216

原创 R语言中数值和字符串处理函数

NA值转换data$age[data$age==99]<-NAfix(data)is.na(data)x<-c(1,2,NA,3)y<-sum(x)#y等于NA,因为X中包括NA值y<-sum(x,na.rm=TRUE)na.omit() #删除不完整的行Sys.Date() #查看系统时间月日a<-(1,2,3)is.number(a)a<-as.character(a)#数据排序newdata<-dat

2020-10-17 16:05:59 1438

原创 R语言按某一列分类求均值+绘图总结

D<-aggregate(.~K,data=data1,mean) #求数据集data1按照K分类后所有列的均值rm(list=ls()) #删除所有对象attach() #锁定某个对象with(mtcars,{print(summary(mpg)),plot(mpg,disp)} #with作用等同attachgrades<-read.table('student.csv',header=TRUE,row.namens='studentid',sep=',')#读表.

2020-10-16 22:18:04 9338

原创 R语言异常值诊断,计算box-cox值

data<-data.frame() #数据框的构建异常值诊断```ry=c(160,260,210,265,240,220,275,160,275,250) x1=c(70,75,65,74,72,68,78,66,70,65) x2=c(35,40,40,42,38,45,42,36,44,42) x3=c(1,2.4,2,3,1.2,1.5,4,2,3.2,3) shuju<-data.frame(y,x1,x2,x3) shuju lm1=lm(y~.,data=

2020-10-16 15:14:59 771

原创 绘制扇形图

import numpy as npimport seaborn as snsimport pandas as pdimport matplotlib.pyplot as pltdata= pd.read_excel('C:\\Users\\MAIBENBEN\\Desktop\\糖尿病.xls')labels=['Diabetes','No Diabetes']#plt.rcParams['font.sans-serif']=['SimHei'] 可解决中文乱码n1=data[data.O

2020-10-12 09:22:03 522

原创 画带有误差线的二分类数据的条形图

import numpy as npa=np.linspace(1,10,5) #从1到10等间隔选5个数print(b=np.mean(a))print(np.average(a,weights=[1,2,3,1,2])) #average可以在求均值的时候赋予权重np.var(a) #总体方差b=[[4,5],[6,7]]np.var(b) #求矩阵所有加起来的标准差np.std(a) #标准差画带有误差线的分类条形图import numpy as np.

2020-10-11 23:16:07 520

原创 python画箱型图,并得出正常值区间,subplot用法

import numpy as np import pandas as pdimport matplotlib.pyplot as pltdata=pd.read_excel('C:\\Users\\MAIBENBEN\\Desktop\\糖尿病.xls')data2=data.sort_value(by='Glucos') # 以葡萄糖这一列为基准进行排序t=(data==0).astype(int).sum(axis=0)#XXX.ndim 输出数组的维度,只有一个数。 XXX.s

2020-10-11 18:33:11 661

原创 python中format&map&lambda用法

>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world' >>> "{0} {1}".format("hello", "world") # 设置指定位置'hello world' >>> "{1} {0} {1}".format("hello", "wo...

2020-02-19 10:18:36 632

原创 用python将pdf文件转化为excel

import pdfplumber from openpyxl import Workbookwb = Workbook() # 创建文件对象ws = wb.active # 获取第一个sheetpath="C:/Users/MAIBENBEN/Desktop/郑州大学.pdf"pdf = pdfplumber.open(path)print('\n')print('开始读取数...

2020-02-18 10:58:46 2959

原创 2-17python笔记——random

函数原型: random.shuffle(x[, random])作用:用于将一个列表中的元素打乱。>>> import random>>> p = ["Python", "is", "powerful", "simple", "and so on"]>>> random.shuffle(p)>>> p['powe...

2020-02-17 11:06:59 105

原创 【python爬虫】爬取Q房网房价

from lxml import etree #从lxml中导入etreeimport requestsimport csvimport timedef writecsv(item): #定义写入函数 with open('qfang.csv','a',encoding='utf-8') as f: writer = cs...

2020-02-15 20:06:55 895 1

原创 Python与数据分析学习笔记(2)Pandas基本功能介绍

目录SeriesDataFrameSeries过滤NaN值DataFrame过滤NaN值DataFrame选取元素Seriesimport pandas as pdser = pd.Series([1,2,3,4,5],index=['a','b','e','d','c'])print(ser)a 1b 2e 3d 4c 5dtype:...

2020-02-01 16:47:29 234

原创 Python与数据分析学习笔记(1)NumPy以及Pandas基本介绍和应用

文章目录一、NumPy和Pandas基本介绍二、NumPy和Pandas安装三、NumPy常用功能介绍和简单示例一、NumPy和Pandas基本介绍NumPy和Pandas是利用Python进行数据分析的最基本的两个库,NumPy是用Python进行科学计算时所用到的基础库。它是大量Python数学和科学计算包的基础,比如Pandas库就用到了NumPy,pandas库专门用于数据分析,...

2020-01-31 21:44:48 810

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除