![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言
文章平均质量分 81
Python捞数人
这个作者很懒,什么都没留下…
展开
-
『R语言&Python』针对多分类离散型变量的特征工程
在训练模型之前,我们常常需要根据不同变量的基本情况进行相应且合理的特征工程,通过阅读文献和自行尝试,我针对多分类变量的特征工程做出了一些总结数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult P.原创 2021-10-02 12:22:28 · 853 阅读 · 0 评论 -
『R语言&Python』建模前的准备:连续型与离散型变量探索,离散型变量转为虚拟变量
在建立模型之前,我们常要先对数据的类型作出判断,连续型数据可以不做处理,而离散型数据则可能需要转为虚拟变量。下文使用R语言中的经典数据集 mtcarsmtcarsmtcars 进行演示Python:Python:Python:数据集内的数据如下(复制粘贴即可):# pythonmpg = [21.0, 21.0, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32.4原创 2021-09-12 21:09:50 · 2196 阅读 · 0 评论 -
『R语言&Python』使用logging、log4r写日志
在开发的过程中,日志能很好的帮助我们记录脚本运行过程中产生的信息,还能帮助我们定位异常,下面总结下R和python中用于写日志的函数原创 2021-09-04 19:04:14 · 1198 阅读 · 4 评论 -
『R语言&Python』 Excel文件的读取以及DataFrame的相关操作 (1)
Python部分:一、读取Excel提到读取数据,就不得不说 pandas 这个库了,它可以读取的文件格式如图;对表格进行数据分析时,常使用 read_csv 或者 read_excel首先把 C:\Users\acer\Desktop\data analysis\Playing.xlsx 文件地址赋值给 filepath,然后使用 pd.read_excel( ) 方法读取该文件,注意参数 sheet_name=1 意味着读取第二个表格import pandas as pdfilepath原创 2021-04-29 22:46:15 · 3622 阅读 · 0 评论 -
『R语言&Python』基础文件操作
目标:利用R/Python实现创建、删除、检测文件知识预备:绝对路径、相对路径和动态路径-绝对路径:直接从盘符开始的描述文件(夹)所在的完整路径。△:可能泄露个人信息# 例如通过下面这个路径别人就能知道我有彩虹六号这个游戏,并且存放路径一目了然path = 'C:\Users\acer\Documents\My Games\Rainbow Six - Siege'-相对路径:通肠胃使用"."或者".."开头,从当前目录或者父目录开始的路径。 △:相对安全> getwd() #获取当原创 2021-06-07 22:11:58 · 288 阅读 · 2 评论