自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 学习笔记——sklearn数据预处理和特征工程(过滤法、嵌入法、包装法)

sklearn机器学习实践 ,利用sklearn深入学习数据预处理与特征工程

2022-08-16 18:33:33 853 1

原创 学习笔记——PCA降维sklearn

PCA降维sklearn学习

2022-08-16 18:14:05 877 1

原创 啃书《机器学习》西瓜书 第1、2章模型评估与模型选择

根据“西瓜书”进行的机器学习基础理论知识的总结。如何进行数据集划分?性能度量指标?

2022-05-26 15:49:37 475 2

原创 爬虫入门知识+简单案例《python网络爬虫从入门到实践》静态网页抓取

爬虫学习第一站:结合《python网络爬虫从入门到实践》书本知识(第三章)+网课学习中的案例实践

2022-05-25 15:10:32 1348

原创 2021 年“泰迪杯”数据分析技能赛B题:python实现肥料登记数据分析(含原始数据)

这周复习了python数据处理的实战,把之前竞赛的题目重新做了一遍。这里侧重数据分析与数据处理的部分。文末含原始题目与数据,需要的小伙伴自取~

2022-05-15 22:40:01 8763 5

原创 2021泰迪杯数据分析技能赛A题:Python实现通讯产品销售和盈利能力分析(含原始数据)

这周复习了python数据处理的实战,把之前竞赛的题目重新做了一遍。这里侧重数据分析与数据处理的部分。文末含原始题目与数据,需要的小伙伴自取~

2022-05-15 21:43:36 11768 9

原创 啃书 《利用python进行数据分析》 第十章数据聚合与分组操作:GroupBy详解、agg()、apply()、pivot_table()、crosstab()详解

啃书 《利用python进行数据分析》 第十章数据聚合与分组操作:GroupBy详解、agg()、apply()、pivot_table()、crosstab()详解

2022-05-05 21:17:14 803

原创 啃书 《利用python进行数据分析》 第八章数据规整:多级索引、数据集合并merge\concat\join\combine_first、透视stack\unstack\pivot\melt

数据规整:多级索引、数据集合并merge\concat\join\combine_first、透视stack\unstack\pivot\melt

2022-05-05 15:02:25 777

原创 数据分析思维学习1:业务指标、数据获取、数据仓库、数据治理、数据分析方法

做数据分析没有思路?来了解看看什么是业务指标、数据获取、数据仓库、数据治理、数据分析方法

2022-05-04 21:06:58 1531

原创 啃书 《利用python进行数据分析》第七章数据清洗与准备

啃书 《利用python进行数据分析》第七章数据清洗与准备

2022-05-01 17:01:40 543

原创 啃书《利用python进行数据分析》Pandas入门

啃书《利用python进行数据分析》pandas入门部分

2022-04-28 17:02:11 706

原创 啃书《利用python进行数据分析》NumPy部分

啃书!《利用python进行数据分析》Numpy部分

2022-04-28 14:25:16 118 1

原创 R语言——ggplot2可视化

R语言ggplot2可视化基础

2022-04-18 15:41:00 1763

原创 R 语言可视化学习之路——基础图形

条形图条形图通过垂直或者水平的条形展示类别变量的分布(频数)。简单用法是barplot(height) height是一个向量或矩阵简单条形图数据library("vcd")载入需要的程辑包:gridWarning message:程辑包‘vcd’是用R版本4.0.5 来建造的 counts<-table(Arthritis$Improved)counts None Some Marked 42 14 28 作图代码barplot(coun

2022-03-10 11:18:35 1324 2

原创 数据标准化

数据标准化在数据分析之前,我们通常需要先将数据标准化,利用标准化后的数据进行数据分析。数据标准化的常用方法有三种“最小-最大标准化”(也叫离差标准化)、“Z-score标准化”和“按最小数定标标准化”最小-最大标准化y=(X−Xmin)/(Xmax−Xmin)y=(X-Xmin)/(Xmax-Xmin)y=(X−Xmin)/(Xmax−Xmin)优点:有效消除量纲(量纲是指物理量的基本属性),将数据有效的映射到[0,1]区间,能够实现不同数据之间的比较缺点:当数据明显集中到某个值上时,转换后

2021-11-15 23:00:26 2176

原创 吃透python——Scikit-Learn数据建模 基础流程概要

吃透python——Scikit-Learn数据建模一、基本介绍sklearn具有分类、回归、聚类、数据降维、模型选择、数据处理六大功能。sklearn中具有用于监督学习和无监督学习的基本方法。sklearn中的函数大致可以分为两类,分别是估计器和转换器。估计器就是模型,用于对数据的预测和回归,转换器就是对数据的处理,如标准化、数据将为及特征选择等。估计器中通常具有三个函数: fit() socre() predict()。 fit()函数用于训练模型 score()函数用于对模型评分 pre

2021-11-15 22:22:40 2337

原创 ROC曲线含义 绘制 解读,AUC指标

ROC与AUC的含义绘制与解读1.ROC曲线ROC曲线是研究学习其泛化性能的有效工具,体现综合考虑学习器在不同任务下“期望泛化性能”的好坏。ROC曲线的纵轴是“真正例率”TPR(true positive rate)和“假正例率”FPR(false positive rate)TPR=TP/(TP+FN)TPR=TP/(TP+FN)TPR=TP/(TP+FN)FPR=FP/(TN+FP)FPR=FP/(TN+FP)FPR=FP/(TN+FP)真正例率:真正例在所有实际正例中占比 (正

2021-11-12 23:54:38 2834

原创 数据分析学习之路006——CSV文件操作1

数据分析学习之路006——CSV文件操作01文件保存:np.savetxt(fname,array,fmt="%d",delimiter=',',header="x,y",comments='')help(np.savetxt)fname:文件或者字符串,文件名字array:存入文件的数组fmt:写入文件的格式,如%d,%.2fdelimiter:分割字符串,默认是任何空格读取文件:np.loadtxt(fname,dtype=np.float,delimiter=None,unpa

2021-05-31 09:40:06 134

原创 数据温习学习之路005——数组的浅拷贝、深拷贝

数据温习学习之路005——数组的浅拷贝、深拷贝栈区:内存中的内存,运行快,空间小些堆区:内存中的硬盘,运行稍慢,空间大些不拷贝:b=a直接赋值,那么栈区没有拷贝,只是用了一个栈区定义了不同的名称浅拷贝:c=a.view()只拷贝栈区,栈区指定的堆区并没有拷贝深拷贝:d=a.copy()栈区和堆区都拷贝了import numpy as npa=np.arange(5)print(a)# [0 1 2 3 4]#不拷贝b=aprint(a is b)#True#浅拷贝c=a.v

2021-05-31 09:39:02 76

原创 NumPy库004数组形状的操作

NumPy库004数组形状的操作1、reshape和resize将数组变成其他形状reshape不会修改原数组的形状,而是返回一个新数组resize直接修改原来的数组import numpy as npa=np.random.randint(0,10,size=(3,4))print(a)'''[[2 5 8 2] [0 8 2 6] [5 2 0 7]]'''b=a.reshape((2,6))print(a)'''[[2 5 8 2] [0 8 2 6] [

2021-05-23 16:28:51 146

原创 数据分析学习之路003——NumPy布尔索引、替换值、广播机制

NumPy库003布尔索引、替换值、广播机制1、布尔索引结果是生成一个新数组,根据条件来判断,新数组的元素都是True或Falseimport numpy as npa1=np.arange(24).reshape((4,6))print(a1>10)'''[[False False False False False False] [False False False False False True] [ True True True True True True]

2021-05-22 21:37:24 255

原创 数据分析学习之路002——Numpy数组 索引和切片

Numpy库002 索引和切片1、一维数组的索引和切片与python列表几乎一样import numpy as npa=np.arange(10)print(a)#[0 1 2 3 4 5 6 7 8 9]#索引print(a[1])#1print(a[-1])#9#切片print(a[:9])#[0 1 2 3 4 5 6 7 8]print(a[2:5])#[2 3 4]print(a[::-1])#[9 8 7 6 5 4 3 2 1 0]2、多维数组的索引与切片impo

2021-05-22 20:32:24 65

原创 数据分析学习之路001——NumPy库基础知识

NumPy库001基础知识numpy数组与python列表的区别1、python列表可以存放不同数据类型,numpy数组只能是相同数据类型2、数组是可以多维的,相当于线性代数的矩阵创建numpy数组1、**np.array(列表)**以列表形式创建2、**np.arange()**产生有规律的数组【和range类似】3、**np.random()**生成随机数数组【这是一个模块,里面有很多函数】a1 = np.random.random(2,2) # 生成2行2列的随机数的数组,元素在[0,

2021-05-22 20:29:42 228

原创 C语言课后习题代码

C语言复习01——课后习题代码练习(小部分有价值的)第五章3⭐️⭐️⭐️⭐️⭐️辗转相处求最大公因数,最小公倍数#include<stdio.h>int main() { int n, m,r; int t; printf("请输入两个正整数:\n"); scanf_s("%d%d", &n, &m); if (n < m) { t = n; n = m; m = t; } int p = n * m; while (m!=0) {

2021-05-22 20:27:56 385

原创 python-wordcloud库

python-wordcloud库wordcloud是优秀的词云展示的第三方库安装:(cmd命令行)pip install wordcloud基本使用:wordcloud.WordCloud()代表一个文本对应的词云可以根据文本中词语出现的频率等参数绘制词云常规方法w=wordcloud.WordCloud()​ 以WordCloud对象为基础w.generate(txt)​ 向WordCloud对象w中加载文本txtw.to_file(filename)​ 将词云输出为图像

2021-03-23 23:08:25 197 1

原创 python-数据维度基础知识、一维、二维

python-数据维度基础知识、一维、二维-数据组织的维度:一维数据:由对等关系的有序或无序数据构成,采用线性方式组织对应列表、数组和集合等概念二维数据:由多个一维数据构成,是一维数据的组合形式表格是典型的二维数据多维数据:由一维或二维数据在新维度上扩展而成高维数据:仅利用最基本的二元关系展示数据间的复杂程度例如:键值对-数据的操作周期存储-表示-操作存储指的是:数据在磁盘中的存储状态,这部分关系数据存储所使用的格式表示:程序表达数据的方式,关系数据类型操作:借助数据类型对

2021-03-23 23:07:47 6899

原创 python文件有关的操作

python 文件-文件打开变量名=open(文件名,打开模式)文件名:可以是绝对路径,和相对路径,如果和原文件在同一目录下,可以直接写文件名打开模式:文件的打开模式描述‘r’只读模式,默认值,若文件不存在,返回FileNotFoundError‘w’覆盖写模式,文件不存在则创建,存在则完全覆盖‘x’创建写模式,文件不存在则创建,存在则返回FileExistsError‘a’追加写模式,文件不存在则创建,存在则在文件最后添加‘b’二进制文件模式

2021-03-22 23:18:03 233 1

原创 python-jieba库

python-jieba库-jieba介绍jieba是优秀的中文分词第三方库,需要额外安装中文文本需要通过分词获得单个的词语jieba提供三种分词模式-jieba库安装pip install jieba 指令,在命令行,要求计算机联网-jieba分词原理利用中文词库,确定汉字之间的关联概率也可以自定义添加词组,适用于某些具体领域-分词的三种模式精确模式:把文本精确的切分开,不存在冗余单词全模式:把文本中所有可能的词语都扫描出来,有冗余搜索引擎模式:在精确模式基础上,对长词再次切分

2021-03-21 14:27:48 832

原创 python-turtle学习笔记

python-turtle学习笔记-turtle库引用1、import turtle​ turtle.函数名(函数参数)能避免函数重名,但是麻烦2、import turtle as t​ t.函数名(函数参数)能避免函数重名,不太麻烦3、from turtle import*​ 函数名(函数参数)简单但不能避免函数同名-turtle画笔控制penup() / pu()抬起画笔,即移动时不会画出东西 (pu是penup的缩写)pendown() /

2021-03-20 20:47:11 241 2

原创 java008 子类与继承 final\abstract

java008——子类与继承1、继承是什么面向对象中在已有类的基础上扩展出新类的方式称为继承。继承用于描述两个类之间的 “ is-a ” 关系。Java不支持多重继承(子类只能有一个父类)2、继承的语法​ class 子类名 extends 父类名 {​ …​ }3、类的树形结构-根节点是Object类(Object是java.lang包中的类),即Object是所有类的祖先类。-除了Object类,每个类都有且仅有一个父类,一个类可以有多个或零个

2021-03-20 18:51:08 206 1

原创 java005

java 005面向对象面向过程:当需要实现一个功能的时候,每一个具体步骤都要亲力亲为,详细处理每一个细节。面向对象:当需要实现一个功能时,不关心具体步骤,而是找一个已经具有该功能的人,来帮忙做事。import java.util.Arrays;public class HelloWorld{ public static void main(String args[]) { int [] array = {10,20,30,40,50}; System.out.println(Arr

2021-03-14 13:39:25 107

原创 java004

java004数组 (须多练习熟练)概念:​ 是一种容器,可以同时存放多个数据值特点:1、数组是一种引用数据类型2、数组当中的多个数据,类型必须统一3、数组的长度在程序运行期间不可改变数组的初始化:在内存中创建一个数组,并且向其中赋予一些默认值两种常见的初始化方式:1、动态初始化(指定长度)​ 数据类型 [] 数组名称= new 数据类型[ 数组长度]new代表,创建新的数组2、静态初始化(指定内容)​ 标准格式:​ 数据类型[] 数组名称= new 数据类型[] {元素1

2021-03-14 13:38:44 46

原创 java003——条件语句,选择语句,循环语句....

java003定义一个方法格式:public static void 方法名称(){方法体}方法名称的命名规则和变量一样,小驼峰注意:1、方法定义的先后顺序无所谓2、方法定义不能产生嵌套包含关系3、方法定义好之后,不会执行的,必须要【调用】才能执行调用方法:在main方法的方法体中输入:方法名称();方法就是:先搞总体,在搞局部判断语句1、单if语句if(关系表达式){​ 语句体;}​ 执行语句体或不执行2、 if …else语句if (关系表达式) {

2021-03-06 22:09:19 148

原创 java002——数据类型、运算符

java002数据精度从低向高排列:​ byte short char int long float double分配字节:1 2 2 4 8 4 8【所以字节数和精度并不相同】数据类型转换自动类型转换(隐式)​ 特例注意:​ 前提:数据范围从小到大强制类型转换(显示)(类型名) 要转换的值;注意事项:​ 1、强制类型转换一般不推荐使用,因为有可能发生精度损失、、数据溢出​ 2、byte/short/char 这三种类型都可以发生数学运算,例如加

2021-03-04 21:43:40 318 1

原创 java基础—标识符、常量、数据类型、变量

java 基础—标识符、常量、数据类型、变量代码大纲package first;// 杠杠开头往后到本行结尾都是单行注释/* 这里面 是多行 注释*/public class HelloWorld { /*上面这一行的 class后面代表定义一个类的名称 类是java当中所有源代码的基本组织单位 public类的名称必须与所在文件名称相同 */ public static void main(String[] args) { //上一行的内容是万年不变的固定写法,代表main

2021-03-04 21:40:37 131 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除