自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 数据预处理步骤以及相关sklearn模块的使用

数据预处理一、数据挖掘的5大流程获取数据数据预处理:让数据适应模型,匹配模型的需求数据类型不同:有的是文字,有的是数字,有的连续,有的离散,有的含时间序列有缺失值,有异常量纲不一,差距太大数据量太大或者太小,呈现偏态特征工程:可以降低计算成本,提升模型上限特征太多或太少特征和标签无关特征之间有相关性建模:测试模型并预测出结果上线,验证模型效果二、sklearn中的数据预处理和特征工程模块preprocessing:几乎包含数据预处理的所有内容模块Impute

2021-03-27 17:30:23 442

原创 给hexo搭建的博客更换主题

怎么给hexo搭建的博客更换主题首先要进入hexo的官网主题界面,找到你所想要的主题网址:https://hexo.io/themes/点进该主题,就会进入你选中的主题的拥有者的博客,你就可以看到这个主题应用起来是什么样子的再点击主题下面该博主的库,然后进去查找该该主题的名字,就会出现一篇博客,将这个主题的下载地址复制下来再安装主题cd 进入hexo的根目录下执行命令:git clone https://github.com/liuyib/hexo-theme-st

2021-01-25 18:53:53 316 2

原创 将Hexo搭建的博客解析到自己的域名

怎样将博客解析到自己的域名如果不想别人访问自己的博客时访问的不是别人的域名,而是自己的域名,就需要进行配置域名解析,将自己的域名解析到xxx.github.io —> 阿里云控制台 —> 域名(以在阿里云购买的域名为例)首先需要在阿里云购买一个自己的域名点进域名 —> 解析 —> 添加记录 ----> 类型选择CNAME解析,即从一个域名解析到另外一个域名,如果是解析到阿里云的服务器就选择A类型 ----> 主机类型那里如果自己域名前面没有东西就写

2021-01-23 17:59:54 418 2

原创 将用Hexo创建的博客托管到GitHub

怎么样将自己的博客托管到GitHubGitHub —> Pages服务 —> 托管你的网页(网站)首先要在GitHub上生成自己的库注册GitHub账号 —> 登录创建名为xxx.github.io的仓库(xxx必须是前面自己的用户名)修改配置文件_config.ymlvim _co nfig.yml注意配置文件中的repo后面必须跟的是在GitHub生成自己的库之后,后面的地址\# Deployment\## Docs: https:

2021-01-23 17:40:39 155

原创 利用Hexo搭建自己的博客

怎么搭建自己的博客?-- 利用HexoHexo是⼀个快速、简洁且⾼效的博客框架,它能够将Markdown格式的⽂档渲染成漂亮的⽹⻚,这样我们就可以在很短的时间内迅速的创建出⽹站的静态内容,所以我们一般是利用Hexo来搭建自己的博客首先要确计算机上面一斤安装了node.js环境和 git环境node --versionnpm --versiongit --version如果没有安装node.js环境和 git环境,可以看之前的博客“CentOS安装软件和服务”,里面都有具体的讲到,按

2021-01-23 10:13:13 183 1

原创 python入门第一天:有关于python基础语法和变量

day 1 基础语法和变量一、python环境的安装准备和PyCharm的使用准备1、python环境的安装和检查在官网上下载好python并安装好之后,点击Windows,并输入cmd,显示命令提示符,按回车键输入python,按回车,如果出现以下图片则代表着电脑已经安装好环境+2、PyCharm的准备工作PyCharm安装好之后,点开软件,则会有三个提示,分别是Creat New Project:创建新工程;Open:打开一个已经存在的工程;Get from Version

2020-12-08 23:12:03 176

原创 随机森林填充特征列的空值

用随机森林填充空值在平时候的数据集中,很多数据不太能够简单粗暴地直接填充众数或者平均值,这样填充反而会影响数据的准确性,所以需要我们对该特征列用随机森林的方法来填充空值步骤:取出需要填充空值的特征列当做标签列Y将没有空值的所有特征列包括原始数据中的标签列取出来当做X手动划分数据集:将Y中有空值的所有行划分成xtest,Y中不是空值的列划分成xtrain同样的方法划分ytrain, ytest导入随机森林的模块,用xtest来预测ytest,从而将Y中所有的空值填充data = pd.r

2021-03-31 19:40:16 686

原创 机器学习之逻辑回归(对数几率回归)

机器学习算法之逻辑回归(对数几率回归)- 做分类的一、概述:逻辑(logistic)回归, 又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域1、几率几率:一个时间发生的概率 / 不发生的概率2、逻辑逻辑:指的是logistic function3、回归回归:来源于线性回归的 Z = XW,使用线性回归去拟合逼近一个‘界’,使得按照这个界进行数据分类后得到的损失函数最小,以概率0.5为分界线,将数据分为正例和反例,使得Z> 0对应于

2021-03-23 14:53:26 1468

原创 机器学习之KNN算法

机器学习之KNN算法——近朱者赤,近墨者黑KNN算法概述KNN的全称是K Nearest Neighbors,意思是K个最近的邻居,也叫作邻近算法核心思想:KNN的原理就是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个类别kNN是一种常见的监督学习方法。工作机制简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k各训练样本,然后基于这k个“邻居”的信息来进行预测,通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任

2021-03-20 16:27:03 566

原创 pandas基础之缺失数据的处理

pandas基础之缺失数据的处理一、了解缺失的信息1.isna 和 notna方法对于对Series使用会返回布尔列表对DataFrame使用会返回布尔表,一般和sum()一起使用,了解每一列具体有多少个缺失值df.isna().sum()School 0Class 4ID 6Gender 7Address 0Height 0Weight 13Math 5Physics

2021-03-16 20:29:49 346

原创 MySQL练习题分享——人力资源管理系统

人力资源管理系统——hrs判断是否存在hrs的库,如果存在的话就进行删除drop database if exists hrs;删库一定要谨慎再谨慎,应该说不论是删什么东西之前都要先进行灵魂拷问,能不能删除创建hrs的库create database hrs default charset utf8mb4;MySQL里面本身是不区分大小写的,字符串的比较区不区分大小写这些是看你设置的校对规则假如后面添加校对规则collate utf8_bin则后面的查询就会区分大小写假如后面添加校

2021-01-30 15:42:40 730

原创 MySQL练习题分享——学习从建表到查询的相关命令

学生选课系统练习题利用DDL(数据定义语言)来建库、建表、删库、删表、修改表:create 、drop、alter利用DML(数据操作语言)来对数据进行插入、删除、更新:Insert 、 delete 、 update利用DQL(数据查询语言)来对数据进行查询:select先判断是否存在school的数据库,如果存在就先把它删除drop database if exists school;创建名为school的数据库并设置默认的字符集create database school defa

2021-01-30 15:11:02 178

原创 MySQL和其相关工具的使用

数据库一、定义1、数据库(database):数据的仓库,它是保存和管理数据的仓库。2、如果希望在程序中实现数据的持久化操作,数据库就是一种非常好的解决方案。BATCMD – 百度、阿里、腾讯、携程、美团、滴滴、IOE – > IBM小型机 / Oracle数据库 / EMC存储设备 -----> 贵x86服务器 / MySQL / DFS ----> 去IOE运动 ----- 性价比非常高二、类型数据库的分类:关系型数据库(SQL)理论基础

2021-01-30 13:53:02 126

原创 Pycharm对Git的支持——push代码和clone代码

pycharm 对Git的支持利用pycharm 往服务器上 push代码到自己的Git库里先点击VCS ----> Enable Version Control Integration …再在弹出来的窗口中选中Git,相当于在文件夹下执行了git init操作在写代码的文件夹下创建一个新的文件,名字必须是.gitignore,即版本控制忽略文件清单再往该文件里面添加你不想传进库里的文件或者文件夹点击右上角的绿色小勾,进行勾选文件,并且写上备注,点击

2021-01-26 15:48:47 817

原创 Linux入门之文件与目录、用户、网络与服务、进程管理

Linux 文件与目录管理文件权限例如用 ls -l code 查询可以得出: -rw-r–r-- 1 root root 79 Jan 20 11:40 hello.py- —> 普通文件,d —> 文件夹,l —> 符号链接rw- —> 文件的所有者对该文件具有怎样的权限r:读权限w:写权限x:执行权限r-- —> 和文件所有者同组的用户有怎样的权限r-- —> 其他用户(既不是所有者也不是同组用户)有怎样的权限Permission Deni

2021-01-26 14:05:20 158 1

原创 vim原理入门

Linux——vimVim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用,基本上 vi/vim 共分为三种模式,分别是命令模式(Command mode),输入模式(Insert mode)和底线命令模式(Last line mode)命令模式命令模式(输入的按键都是命令)移动光标的命令:h j k l ------> 左 下 上 右 (可以配合数字使用)(100j 往下面移动100行)gg ----->

2021-01-26 11:40:00 403 3

原创 Git操作原理入门

Git工具的使用团队开发如果没有版本控制,对代码、文档、资源文件的管控将是一场噩梦首先了解一下版本控制的历史1990s ----> VSS (Visual Source Safe) / CVS (Concurrent Version System) ----> 锁定模式2000 ----> Subversion (SVN) ----> 合并模式2005 -----> Git -----> 合并模式 ----> 分布式版本控制系

2021-01-26 11:25:50 116

原创 Linux之CentOS安装软件和服务

CentOS安装软件和服务一、使用包管理工具yum进行安装使用包管理工具(最稳当、最方便)yum - Yellow -dog Update Modified - 联网使用搜索:yum search nginx安装:yum install -y nginx更新:yum update nginx更新全部:yum update卸载:yum remove -y nginx / yum erase -y nginx查看安装软件的相关信息:yum info nginx列出所有安装的软件包:y

2021-01-20 19:35:37 196

原创 Linux入门之Linux操作系统基础

一、了解Linux操作系统以及它所需要的配置Unix —> 商业化的Unix服务器 —> AIX / HP-UX / SolarisWindows —> Server / Advanced Server / Data CenterLinux —> 发行版本很多,很多发行版本不需要付费:Redhat / CentOS,我们一般使用CentOS就可以了,因为它相当于是Redhat的免费版本云服务器:最灵活,伸缩性最好,性价比最高的选择。在购买了云服务器之后,

2021-01-20 19:34:01 316

原创 Python进阶之利用三方库aiohttp实现异步编程

利用三方库aiohttp实现异步编程1、三方库aiohttp的使用方法UA = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'async def fetch_title(url): # session用完了是需要关上的,所以要利用上下文语法with async with aiohttp.Client

2021-01-12 20:52:21 188 2

原创 Python进阶之异步编程的含义和使用方法

异步编程异步编程-----> 异步I/O(AIO)-----> 协作式并发 -----> 提高了CPU的利用率 -----> 协程同步—> 排队 ----> 有顺序 ----> 阻塞和等待异步—> 不排队 ----> 没有顺序 ----> 不阻塞和不等待要想了解异步编程的用法,首先得清楚迭代器和生成器迭代器(iterator):实现了迭代器协议的对象迭代器协议实际上是两个魔术方法:_iter__next_# 写一个迭

2021-01-12 20:40:01 214 1

原创 Python进阶之前端和爬虫基础

前端和爬虫基础一、了解前端页面源代码1、了解前端页面源代码的构成html全称HyperText Mackeup Language,翻译为超文本标记语言,它不是一种编程语言,是一种描述性的标记语言,用于描述超文本内容的显示方式,主要由三样东西构成:标签 - 数据(content - 承载了页面的内容)层叠样式表(CSS)- 显示(display - 渲染页面)JavaScript(JS) - 行为(behavior - 控制页面交互式行为)命名规范:驼峰式命名(从第二个单词开始首字母

2021-01-10 15:05:02 737 6

原创 python进阶之web前端概述和常用标签

web前端概述和常用标签一、web前端概述1、了解URL的构成https://www.baidu.com:443/index.htmlURI - 统一资源标识符URL - 统一资源定位符(常用)URI = URL + URN(x)协议 - HTTP/HTTPSHTTPS - HTTP over SSL - 安全的HTTPHTTP - Hyper-Text Transfer Protocol - 超文本传输协议HTML - Hyper-Text Markup

2021-01-05 21:16:41 187

原创 Python入门第13天-包和文件操作

day13-包和文件操作一、包1、什么是包包是python工程中一种专门用来管理py文件的文件夹,这个文件夹中有一个特殊文件:init.py项目中的普通文件夹一般用来管理项目需要的非代码文件2、在程序中怎么使用包里面的内容放在包里面的py文件不能直接导,能直接导的只有放在外面的py文件(1)import 包名导入后可以通过‘包名.’ 去使用这个包中的init.py 文件中定义的所有全局变量import fileManagerprint(fileManager.x) #

2020-12-25 16:14:07 264

原创 day12 作业

写一个装饰器@tag要求满足如下功能:@tag(name='p')def render(text): # 执行其他操作 return text@tag(name='div')def render2(): return 'abc'print(render('Hello')) # 打印出: <p>Hello</p>print(render2()) # 打印出: <div>abc</div>def tag(..

2020-12-23 21:03:31 66

原创 Python入门十二天- 迭代器、生成器和模块

day12 - 迭代器、生成器和模块一、有参装饰器1、应用场景如果实现装饰器的功能时需要额外的数据,就需要有参装饰器2、固定语法def 函数名(参数列表):​ 定义无参装饰器函数​ return 午餐装饰器函数名参数列表 - 参数列表的个数是看实现装饰器功能时需要多少个额外的数据,如果不需要额外的数据就使用无参装饰器函数名 - 创建装饰器的函数名def creat_tag(name): def tag(f):

2020-12-23 21:02:34 201

原创 高阶函数作业

为函数写一个装饰器,在函数执行之后输出 afterdef after(f): def new_f(*args, **kwargs): result = f(*args, **kwargs) print('after') return result return new_f@afterdef func1(a, b): print(a + b)func1(10, 20)为函数写一个装饰器,把函数的返回值 +100 然后再..

2020-12-23 09:13:22 88

原创 Python入门第十一天-高阶函数

day11-高阶函数一、高阶函数1、函数就是变量定义函数就是在定义变量,函数名就是变量名python中定义函数就是定义类型是function的变量,函数名就是变量名变量能做的函数都能做函数加括号是在获取返回值,假如使用时没有加括号,就是获得一个函数x = 100def func1(): print('我是一个函数')一个变量可以给另外一个变量赋值y = xprint(y + 100)z = func1z() # 我是一个函数,令z调用函数修改

2020-12-22 20:20:51 294

原创 Python入门第十天-函数进阶

day10-函数进阶一、函数的参数1、位置参数和关键字参数实参按照传递方式的不同分为位置参数和关键字参数(1)位置参数调用函数时让形参和实参一一对应(第一个实参给第一个形参赋值,第二个实参给第二个形参赋值)格式:数据1,数据2,数据3,…(2)关键字参数让实参和形参通过关键字(形参名)对应格式:形参名1 = 数据1(实参),形参名2 = 数据2,…(3)关键字参数和位置参数混用混用时位置参数必须在关键字参数前面def func1(x, y, z): print(f

2020-12-22 09:10:18 349

原创 Python入门第九天-格式字符串和函数基础

day9-格式字符串和函数基础一、格式字符串1、r语法python中可以在字符串的最前面(引号前)加r/R,来阻止字符串中的转义字符转义r可以让字符串中的转义字符都变成普通字符应用:写路径时一般加r,防止路径中出现转义的情况str1 = '\tabc\n123'print(str1)str2 = r'\tabc\n123'print(str2)2、格式字符串主要解决的问题:需要写的字符串中有一部分是不确定的,可能会根据变量来确定情况完成以下格式的messageme

2020-12-21 09:58:05 131

原创 Python入门第8天-字符串

day8-字符串一、字符串和字符1、什么是字符串字符串是容器型数据类型,将单引号或者双引号,或者三个单引号、三个双引号(可以直接换行)作为容器的提示,里面的每个独立的文字信息就是他的元素(引号中的每个符号都是字符串的元素)元素:引号中的每个符号,文字符号,图形符号,各种符号都可以,元素又叫字符特点:不可变(支持增删改);有序的(支持下标操作)如果题目里有对字符串就行修改的操作是产生一个新的字符串,原字符串是不会修改的s1 = 'a6,您好's2 = '❥(^_-)'# '''和"""对

2020-12-18 09:07:19 299 2

原创 day8-字符串作业

输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**str1 = 'abcd1234'print(str1[1::2])输入用户名,判断用户名是否合法(用户名长度6~10位)str2 = 'abc123456'length = len(str2)if 6 <= length <= 10: print('合法')else: print('不合法')输入用户..

2020-12-18 09:05:57 177

原创 day7字典和集合作业

1.声明一个字典保存一个学生的信息,学生信息中包括: 姓名、年龄、成绩(单科)、电话、性别(男、女、不明)stu1 = {'姓名': '小明', '年龄': 18, '成绩': 90, '电话': '15789764400', '性别': '男'}stu2 = {'姓名': '小红', '年龄': 20, '成绩': 85, '电话': '15789764410', '性别': '女'}stu3 = {'姓名': '小放', '年龄': 17, '成绩': 78, '电话': '15789764420

2020-12-16 21:13:54 442

原创 Python入门第七天-字典和集合

day7-字典和集合一、字典数据需要区分就用字典,不需要区分就用列表1、字典存在的价值可以在同时保存多个意义不同的数据的时候通过key来对数据进行区分和说明2、什么是字典(dict)(1)字典字典是容器型数据类型,将{}作为容器的标志,里面多个元素(元素的键值对)用逗号隔开{键1:值1,键2:值2,键3:值3}(2)字典的元素必须是键值对键 - 必须是不可变数据(数字,字符串,元组),一般用字符串(功能是对值进行说明);必须是唯一的,同一个键在字典里只能出现一次值 - 任何

2020-12-16 20:55:57 215

原创 列表的作业题

1.生成50-300之间可重复的 10个数据 存放于列表中, 保证列表中元素的顺序,对列表进行排重,并对列表使用排序算法进行降序排序例如:随机生成了[70, 88, 91, 70, 107, 234, 91, 177, 282, 197] --- 去重之后 [70, 88, 91, 107, 234, 177, 282, 197] ---- 降序排序 [282, 234, 197, 177, 107, 91, 88, 70]nums = [70, 88, 91, 70, 107, 234,

2020-12-15 21:18:11 434

原创 Python入门第六天-列表和元组

day6 列表和元组一、列表相关操作1、数学运算:+、*(只支持这两个,别的不支持)(1)列表1+列表2 - 将两个列表合并成一个新的列表list1 = [1, 2, 3]list2 = [100, 200]print(list1 + list2) # [1, 2, 3, 100, 200](2)列表*N - 列表中的元素重复N次产生一个新的列表(N是>=0的整数)list3 = list1 * 3print(list3) # [1, 2, 3, 1, 2, 3, 1,

2020-12-15 21:11:03 425

原创 Python入门第五天-数字和列表

day5 数字和列表一、数字python中数字相关类型有三个:int(整型)、float(浮点型)、bool(布尔)、complex(复数)1、int(整型)-所有整数对应的类型:正数、负数和0表示的时候:数字直接写转换:int(数据)- 把其他数字转换成整型注意:不是所有数据都可以转换成整数的,只有浮点数、布尔和部分字符串才行python2.x中整数有两种类型:int、long(1) 浮点数转换成整数:直接去掉小数部分,保留整数部分,没有什么向下取整print(int(12.5))

2020-12-14 21:13:00 382

原创 Python入门第四天-循环关键字和位运算

day4 循环关键字和位运算一、循环关键字1、continue注意:continue是关键字,只能出现在循环体中作用:当执行循环体时,如果遇到continue,档次循环直接结束,马上进入下次循环的判断(遇到continue结束一次循环)# 练习:计算1-100中所有不能被3整除的数的和# 方法一:sum1 = 0for x in range(1, 101): if x % 3 != 0: sum1 += xprint('和:', sum1)# 方法二:

2020-12-13 22:57:41 424 2

原创 Python入门第三天-分支和循环

day3 分支和循环一、if - elif - else1、应用场景针对不同的条件实现不同的操作2、注意不同条件之间满足:如果其中一个条件已经满足了,就没有必要判断其他条件的必要3、语法if 条件语句1:代码段1elif 条件语句2:代码段2elif 条件语句3:代码段3…else:代码段N4、强调后面的条件是在前面的条件不成立的前提下进行判断的如果条件之间是没有关系的,有几个条件就要用几个if如果条件之间是有关系的,就要用if- elif结构# 练习

2020-12-10 20:53:29 148

原创 python入门第二天-运算符和if分支

day2 运算符和if分支一、数学运算符:+(加)、-(减)、*(乘)、/(除)、//(整除)、%(取余、取模)、**(幂运算)1、+、-、*、/和数学中的加减乘除功能和用法一模一样print(1+1)print(2*5)print(5/2)# 运算结果还可以保存在变量中result = 2-5print(result)2、// - 求商,然后商保留整数部分,向小取整当被除数和除数都是整数的话,如果没有余数的话,商就是整数型,如果是整除的话商也是整数型print(5/2)

2020-12-09 20:13:55 319

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除