changhaiyisheng520-CSDN博客

原创 zip、dataframe、open、concat、merge、dataframe的列名重新排序用法总结

zipzip() 函数是 Python 内置函数之一，它可以将多个序列（列表、元组、字典、集合、字符串以及 range() 区间构成的列表）“压缩”成一个 zip 对象。所谓“压缩”，其实就是将这些序列中对应位置的元素重新组合，生成一个个新的元组。#python2.0+的输出实例a = [1,2,3]b = [4,5,6]c = [4,5,6,7,8]zipped = zip(a,b) # 打包为元组的列表[(1, 4), (2, 5), (3, 6)]zip(a,c)

2022-04-15 11:32:48 1467

原创在16个不同州市中分别随机抽取30个样本，并保存到同一个excel表格中。（批量合并多个sheet表）

分类变量的相关统计指标#对分类变量分类汇总df['州市'].value_counts()# 取出分类变量的unique值，并转化为列表zhous = df['州市'].unique().tolist()# 查看分类变量的类别数df['州市'].nunique()# 取出州市为昆明的数据df.loc[df['州市'] == '昆明市']随机抽样并保存结果对每个州市随机抽取30个样本，并分别保存到同一个excel的不同sheet表中# 进行随机抽样，并把得到的数据框保存到不同的she

2022-04-15 10:48:10 745

原创 pandas中将百分数转化为浮点数以及去除重复数值

pandas中将百分数转化为浮点数以及去除重复数值导入数据去除重复值总结导入数据study_information = pd.read_csv("E:/jupyter/education/data/study_information.csv",encoding='gbk')#查看数据study_information.head(10)#切分learn_process列，保留数字（切开以后的第二部分）study_information['learn_process'] = study_info

2022-03-13 21:27:59 1934

原创利用pandas对日期、国家省市数据进行预处理

利用pandas对日期、国家省市数据进行预处理提示：日期格式形如 “2018-09-06 09:32:47”国家省市数据形如"中国广东广州首先查看原始数据login = pd.read_csv("E:/jupyter/education/data/login.csv",encoding='gbk')login.head(10)注：encoding = 'gbk'是为了解决读取以后汉字乱码的问题数据显示如下图。拆分login_place注：目标是将login_place列数据拆分为国家、

2022-03-13 21:07:39 1047

原创 anaconda安装cpca包报错

anaconda安装cpca包报错第一种报错第二种报错第一种报错conda install cpcaCollecting package metadata (current_repodata.json): failed可以关闭vpn试试，亲测有用！第二种报错conda install cpcaPackagesNotFoundError: The following packages are not available from current channels:- cpca尝试使用

2022-03-13 16:02:59 782

原创 R语言读取各种类型的数据文档

R语言读取各种类型的数据文档读取xls,xlsx文件library(readxl)raw_data<-readxl(E:/raw_data.xls)更多内容可以参考：（网址）[https://readxl.tidyverse.org/]读取csv文件library(readr)yiqing <- read_csv("yiqing.csv",sep=",")View(yiqing)读取txt文件pos <- read_table("pos.txt")利用read_

2021-05-10 15:53:15 582

原创 R语言出现中文乱码

R语言出现中文乱码解决方法：点击File—Reopen with encoding-----UTF-8#操作完成后，R语言中文乱码即可恢复正常。

2021-03-15 12:38:37 6797

原创 R语言爬虫：当当网销售量Top500（批量爬取多个网址数据）

R语言爬虫：当当网销售量Top500运用R语言中rvest包对数据进行爬取。本文主要分为两个板块，第一版块主要讲解爬取一个页面数据的R语言代码，第二版块讲解批量爬取25个页面的R语言代码文章目录当仅仅爬取一页的数据时R语言代码及讲解1.导入需要的函数2.读入网址3.从网页中爬取数据4.将爬取的数据整合成数据框5.保存数据当爬取该网站所有页面时R语言代码及讲解1.paste函数批量处理网址2.首先为需要爬取的各个数据创建空白变量3.从对应网页中批量爬取数据4.将爬取的数据转换为1列的数据，以便后续合并数

2021-03-13 20:49:46 3475 4

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

changhaiyisheng520的博客