自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 python连接impala获取数据并推送至企业微信机器人

python连接impala获取数据并推送至企业微信机器人安装依赖包安装依赖包pip install saslpip install thriftpip install thrift-saslpip install impyla pip install saslpip install thriftpip install thrift-saslpip install impyla 数据库连接导入基础包#导入pandas模块import pandas as pdimport n

2021-07-02 16:11:11 186

原创 MAC系统下查看和生成SSH KEY 的方法

MAC系统下查看和生成SSH KEY 的方法一、打开vim(terminal.app)查看本地是否存在SSH-Key# ls -al ~/.ssh如果vim输出的是如下内容:证明本地没有生成的SSH Key,请执行第二步。# No such file or directory如果vim输出的是如下内容: 证明本地已经存在SSH Key 文件,请执行第四步。# id_rsa id_rsa.pub二、如果没有,生成新的SSH Key#ssh-keygen -t rs

2021-04-26 11:35:44 357

原创 用Python做数据分析--七大数据类型之字典

字典字典是一种可变数据类型点典的元素存储方式是键值对的形式,键值对之间用逗号隔开键值对的形式形如:key:value最外层用{}括起来d = {key1 : value1, key2 : value2 }由于字典是键值对的形式,所以字典是无序的,自然不能切片和索引,而是通过键来取值键:一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一值:可以取任何数据类型,但键必须是...

2020-03-02 21:43:06 390

原创 SVM参数及方法

SVM的基本概念一些简单的基本概念:分隔超平面:将数据集分割开来的直线叫做分隔超平面。超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。间隔:一个点到分割面的距离,称为点相对于分割面的距离。数据集中所有的点到分割面的最小间隔的2倍,称为分类器或数据集的间隔。最大间隔:SVM分类器是要找最大的数据集间隔。支持向量:坐落在数...

2020-03-01 15:05:13 873

原创 用Python做数据分析--七大数据类型之列表

Python数据类型–列表1.列表的两种定义方式1.1 list命名s = 'python' # 目前的可迭代对象,我们就学了一个字符串L = list(s)Ltype(L)1.2 用[ ] 来定义# 列表中的内容可以是任意的数据类型list = [1234,'Hello',3.14,True,'abc']list2.列表的一些运算2.1 +号运算,使得...

2020-02-20 22:30:12 370 1

原创 Python数据清洗实战案例--拉勾招聘数据清洗

Python数据清洗实战案例–拉勾招聘数据清洗(本篇博客主要介绍个人对一份数据的清洗代码和清洗效果)主要涉及应用的库是numpy、pandas、matplotlib,话不多说,直接上代码#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactiv...

2020-02-16 19:45:05 6578 14

原创 sklearn决策树实战案例

sklearn决策树实战案例#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"import numpy as npimport pandas as pdimport matplotlib.pyplot as p...

2020-02-13 10:32:33 527

原创 MYSQL基础知识归纳

Mysql 基础

2020-02-12 12:00:34 184

原创 sklearn实战之kmeans(聚类)

kmeans聚类算法案例本篇博客只做个人对kmeans算法代码的案例展示# 常规的导包from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactive='all'import numpy as npimport pandas as pdimport matpl...

2020-02-11 17:25:30 1548

原创 sklearn之Knn实战乳腺癌数据案例

sklearn之Knn实战乳腺癌数据案例(此处博主不细说Knn算法的基础逻辑,有兴趣可自行百度)(导入的数据是sklearn自有的乳腺癌数据,sklearn有大量内置的数据,详细可点击sklearn数据集链接)from sklearn.datasets import load_breast_cancer#导入乳腺癌数据集的类from sklearn.neighbors import K...

2020-02-11 12:14:16 5871

原创 用python做数据分析--七大数据类型之数值型

数值型数值型数据在python中是不可变数据类型,包含整数型int、浮点数型float、复数型complex整数型intPython中的整型属于int类型,,默认用十进制表示,此外,也支持二进制,八进制,十六进制表示方法。浮点数型float浮点数是属于有理数当中的,Python中的浮点数就是数学当中的小数, 在运算中,整数与浮点数运算的结果依旧是浮点数。复数型complex语法:...

2020-01-11 22:37:37 760

原创 用python做数据分析一七大数据类型之字符串

字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。在python中:字符串是不可变数据类型,也是有序数据类型字符串有2种定义方法;1.通过str()函数对字符串进行定义,例如下图:eg:2.通过直接加引号进行定义...

2020-01-09 23:01:27 686

原创 用python做数据分析一七大数据类型之布尔型

布尔型数据类型在计算机科学中,布尔数据类型又称为逻辑数据类型,是一种只有两种取值的原始类型:非零(通常是1或者-1)和零(分别等价于真和假)。在python中,布尔型数据类型是不可变数据类型,取值只有true 和 false,可以拿来做算术运算,此时等价于 1 和 0。eg:布尔型数据类型在python中表示的数据类型是bool;可用**type()**命令行来查看;eg:...

2020-01-05 13:58:44 521

原创 用python做数据分析一基础语法

Python–基础语法标准输出函数–print()输出函数什么叫输出呢,比如我们的一台电脑,是可以在屏幕上显示内容的。数字啊,图片都可以。当然呢,底层怎么去控制电脑在屏幕上显示什么我们不知道,当然也不用知道,我们只需要知道其对应的python语句就行了。python里面的输出语句是用的print()函数,关于函数的概念,我们会在后面函数部分进行详细的讲解。接下来呢就是希望在电脑上打印出 ...

2020-01-04 14:07:24 458

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除