自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 SQL常用技巧-查询-取数-转化-参数

数据类型转换CAST((SUBSTR(o.create_time FROM 12 FOR 2)) AS SIGNED) b

2019-12-19 12:09:27 1226

原创 常用机器学习算法模型简版代码

# -*- coding: utf-8 -*-"""Spyder EditorCreated on Wed Aug 23 10:18:27 2019@author: lenovo"""import osimport pandas as pdfrom sklearn import metricsfrom sklearn import preprocessingfrom sklea...

2019-12-18 12:09:27 653

原创 python窗口函数

窗函数(window function)转自:https://www.jianshu.com/p/f6e489de57f7用来截取的函数就叫窗函数,窗函数又分很多种,什么矩形窗、三角窗、高斯窗。移动窗口函数rollingDataFrame.rolling(window, min_periods=None, freq=None, center=False,...

2019-12-16 18:57:28 3092

原创 python索引-ix-loc-iloc

loc:对应的索引值(均是数值可连续并取范围)iloc:索引的位置号

2019-12-16 18:55:02 186

原创 np.random.normal()正态分布

np.random.normal()正态分布numpy中高斯分布的概率密度函数numpy.random.normal(loc=0.0, scale=1.0, size=None)参数的意义为:loc:float 概率分布的均值,对应着整个分布的中心centerscale:float 概率分布的标准差,对应于分布的宽度,scale越大越矮胖,scale越小,越瘦高size:int or...

2019-12-15 22:07:56 1956

原创 K-means聚类最佳k识别

# silhouette系数,越大越好import numpy as npfrom sklearn.cluster import KMeansfrom sklearn import metricsimport matplotlib.pyplot as pltplt.subplot(3, 2, 1)x1 = np.array([1, 2, 3, 1, 5, 6, 5, 5, 6, 7, ...

2019-12-15 22:04:35 500

原创 scipy cluster库聚类方法-附python代码

scipy cluster库简介scipy.cluster是scipy下的一个做聚类的package, 共包含了两类聚类方法:矢量量化(scipy.cluster.vq):支持vector quantization 和 k-means 聚类方法层次聚类(scipy.cluster.hierarchy):支持hierarchical clustering 和 agglomerative cl...

2019-12-15 22:01:01 1616

原创 scala 和 spark的安装与使用

一、安装JDK(建议JDK7以上)略二、安装Hadoop 2.x略三、安装Scala(2.10.4)在root用户下分别执行下列操作1.获取并解压安装包tar –zvxf scala-2.10-2.10.4.tgzmv scala-2.10.4 scala2.配置环境变量gedit sudo /etc/profile加入如下代码export SCALA_HOME=/ho...

2019-12-13 19:22:50 522

原创 windows 上安装配置 mysql

1.下载MySQL简单方便,笔者以MySQL5.7版本为例,可以百度搜索MySQL,点击下载专区,按步骤找到相应的版本,笔者Windows64位,选取MySQL5.7.28,64位Zip下载。2.解压配置下载完后,我们将 zip 包解压到相应的目录,这里我将解压后的文件夹放在 D:\software\mysql-5.7.28-winx64 下。接下来我们需要配置下 MySQL 的配...

2019-12-13 19:21:23 116

原创 hadoop集群的安装与配置

1.安装和配置虚拟机1.1安装VMwareWorkstation12pro虚拟机1.2安装vmwaretools工具2.Hadoop集群配置过程2.1 集群中的机器,都要有的配置:安装jdk 7+,并配置好环境变量Hadoop-2.x.x安装包,配置好Hadoop参数(重点1)都要安装SSH服务,如果没有安装ssh服务,则启动每台机器,分别安装ssh服务:$ sudo apt-...

2019-12-13 13:45:32 391

原创 mysql创建及查看视图等操作

# 创建视图CREATE VIEW ab ASSELECT * FROM data_0925_01 limit 10select * from information_schema.views #查询所有的视图show tables #可查看所有的视图和表select * from information_schema.tables #查询所有的表INNODB #一般自...

2019-12-12 12:57:13 7986 1

原创 centos7的安装与配置

一、centOS7-配置网络地址/etc/sysconfig/network-scriptsvi ifcfg-ens33ONBOOT=yesservice network restart转自链接:http://www.cnblogs.com/c-xiaohai/p/6509581.html二、安装图形界面Gnome先检查yum 是否安装了,以及网络是否有网络。如果这两者都没有,先...

2019-12-11 13:58:23 245

原创 map, applymap and apply的区别

#1.apply()#当想让方程作用在一维的向量上时,可以使用apply来完成,如下所示frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])f = lambda x: x.max() - x.min()frame.apply(...

2019-12-10 11:54:29 259

原创 mysql笛卡尔积排序

create table tbl (id VARCHAR(32), col int);DROP TABLE tb1;insert into tbl values ('a',56), ('a',46), ('a',35), ('b',68), ('b',33), ('b',92);SELECT * FROM tbl;SELECT ...

2019-12-09 14:03:04 407

原创 python利用matplotlib包画图

# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplif __name__ == '__main__': data = pd.read_excel('abc.xlsx','Sheet1')[['phon...

2019-12-06 13:08:19 200

原创 Python连接MySQL常用方法-MySQLdb

MySQLdbMySQLdb#使用python连接mysql数据库,结合pandas 读取数据import MySQLdbimport pandas as pdimport numpy as np#使用python连接数据库conn = MySQLdb.connect( host = 'rr-2ze6hfadldfada23dfad.mysql.rds.aliyuncs...

2019-12-05 14:11:11 212

原创 Python常用函数笔记汇总1

cat1 = pd.qcut(data,[0,0.1,0.5,0.9,1.],precision=2) #自定义分位数。df.take(np.random.permutation(len(df))[:cnt]) #从df中随机抽取70%data[(np.abs(data)>3).any(1)] #全部abs大于3的行和列,以下两种不可取。df.take(np.random.permutation(len(df))[:3]) #从5中随机取3个。

2019-12-04 18:08:57 936 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除