自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 用交叉验证调整KNN模型的参数

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np#加载数据def inspect_data(file_root): dataframe=pd.read_csv(file_root) print("数据基本信息:") print(dataframe.info()) pri...

2018-08-17 15:13:30 1628

原创 用SVM识别手写体案例

from sklearn import datasetsfrom sklearn import svmiris=datasets.load_iris()digits=datasets.load_digits()#选择SVM模型svm_classifier=svm.SVC(gamma=0.0001,C=100)#手动划分训练集,测试集n_test=100#测试数量train_x=d...

2018-08-16 16:07:04 689

原创 电影票房案例分析

import pandas as pd#加载数据def read_data(file_root): dataframe=pd.read_csv(file_root) print("数据的基本信息:") print(dataframe.info()) print("数据的行是%i,列是%i"%(dataframe.shape[0],dataframe.shape...

2018-08-15 22:02:31 1741

原创 星际争霸游戏战队案例分析

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#1.加载并查看数据基本信息def read_dataset(file_root): dataframe=pd.read_csv(file_root) print("数据的基本信息:") print(dataframe.info(...

2018-08-15 15:02:58 448

原创 BP人工神经网络案例

#BP人工神经网络实现#1.读取数据#2.导入keras.models Sequential /keras.layers.core Dense,Activation#3.Squential 建立模型#4.Dense 建立层#5.Activation激活函数#6.compile模型编译#7.fit训练(学习)#8.验证(测试,分类预测)import numpy as npim...

2018-08-14 10:45:21 979

原创 聚类K—means案例

import pandas as pdimport numpy as npimport matplotlib.pylab as pylfile_root="路径文件"dataframe=pd.read_csv(file_root)x=dataframe.ix[:,:].as_matrix()from sklearn.cluster import KMeansk_mean=KMean...

2018-08-13 09:59:34 617

原创 决策树ID3算法案例

import pandas as pdfile_root="G:/python/源码/源码/lesson.csv"dataframe=pd.read_csv(file_root,encoding="gbk")#print(dataframe)x=dataframe.ix[:,1:5].as_matrix()y=dataframe.ix[:,5].as_matrix()for i in...

2018-08-12 18:20:03 1183

原创 逻辑回归案例

import pandas as pdroot="G:/python/源码/源码/luqu.csv"dataframe=pd.read_csv(root)#print(dataframe)x=dataframe.ix[:,1:4]y=dataframe.ix[:,0]from sklearn.linear_model import LogisticRegressionmodel2=...

2018-08-12 14:09:44 1238

原创 朴素贝叶斯分类算法的实现

import numpy as npdef bayes(train_data,labels,test_data): train_data_num=len(train_data)#测试数据或类别长度 not_r_label=set(labels)#不重复的类别 label_rate={} for item in not_r_label: label...

2018-08-12 08:21:51 209

原创 SQL练习题

-- 9、 查询“95031”班的学生人数。select count(1) from student where class = 95031;-- 10、查询Score表中的最高分的学生学号和课程号。select sno, cno from score where degree = (select max(degree) from score );-- 11、查询‘3-105’号课程的平均分。se...

2018-05-26 21:26:48 271

原创 python连接mysql

import pymysqlconnection=Nonecursor=Nonetry: connection=pymysql.connect('localhost','root','root','test1') cursor = connection.cursor() sql = 'insert into dept values (%s,%s,%s)' tr...

2018-05-07 16:35:29 119

原创 SQL子查询

-- 子查询-- 子查询语句可以在select, from where 中-- 查询工资高于平均工资的雇员名字和工资。select ename, sal from emp where sal > (select avg(sal) as avg_sal from emp);-- 查询和scott同一部门且工资比他低的雇员名字和工资select t1.ename, t2.sal from emp...

2018-05-06 20:35:31 197

原创 SQL表连接

-- 表链接-- 内链接use test1;-- 第一中表示方式(没有外键约束的两张表一般使用第一种):select ename, dname from emp, dept where emp.deptno = dept.deptno;-- 第二种表示方式(有外键约束)select ename,dname from emp inner join dept on emp.deptno = dept....

2018-05-06 16:34:15 155

原创 SQL事务和表的关系

-- 事务create table t_account(id int(8) primary key,money double)-- rollback 是回滚即删除事务begin;update t_account set money=money-100 where id=1;update t_account set money=money+100 where id=2;COMMIT;-- 表的关系-...

2018-05-06 13:49:34 367

原创 SQL索引和视图

-- 创建emp表ename字段的索引create index i_emp_index on emp(ename);-- 删掉索引drop index i_emp_index;-- 创建一个视图create view v_emp as select empno,ename,job from emp;select * from v_emp limit 1;insert into v_emp valu...

2018-05-05 22:40:31 567

原创 SQL表的约束

-- emp表的emptno字段增加外键dept表的deptnoalter table emp add constraint foreign key (deptno) references dept (deptno);create table t_dept(id int(8) primary key,name varchar(200) not null,emp_max_count int(2) c...

2018-05-05 21:55:21 221

原创 SQL分组查询和过滤

-- 统计每个部门的平均工资,存在group by分组,select字句不能写group by没有的字段,除非这些用在聚合函数中select deptno,avg(sal) from emp group by deptno;-- 统计每个部门的人数,最高工资,最低工资,平均工资select count(0) as 人数, max(sal) as 最高工资, min(sal) as 最低工资,avg...

2018-05-05 14:46:24 1979

原创 SQL聚合函数和内置函数

use test1;-- 统计一共有多少个员工select count(*) from emp;select count(1) from emp;select count(empno) from emp;-- 工资最高的select max(sal) from emp;-- 平均工资select avg(sal) from emp;-- 字符串链接的函数select CONCAT(ename,'的...

2018-05-05 11:33:57 665

原创 SQL语句之select

-- 查询emp的所有数据select * from emp;-- 指定字段进行查询select empno, job, ename from emp;-- 查询所有员工的年薪select ename,sal*12 as 年薪 from emp;-- 别名使用 as,as 可以省略select ename,sal*12 年薪 from emp;-- 去重select distinct deptno...

2018-05-04 15:19:30 179

原创 SQL语法之DDL

-- 创建表create table t_student(id int(8) PRIMARY KEY,grade int(8) not null,address varchar(200) not null UNIQUE);-- 删除表drop table t_student;-- 在表中添加一个新字段alter table t_person add grade int(8) DEFAULT 0;-...

2018-05-04 13:21:35 150

原创 Series和DataFrame的柱状图

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pandas import Seriesfrom pandas import DataFrame#Series画柱状图fig,axes=plt.subplots(2,1)#两行一列data=Series(np.random.rand(16)...

2018-04-05 20:42:54 3590

原创 用matplotlib设置标题、轴标签、刻度标签以及添加图例

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfig=plt.figure()ax=fig.add_subplot(1,1,1)ax.plot(np.random.randn(1000).cumsum())x_ticks=ax.set_xticks([0,250,500,750,1000])x_...

2018-04-05 16:39:21 26138

原创 检测和过滤异常值

from pandas import Seriesimport pandas as pdimport numpy as np#np.random.seed(12345)data=pd.DataFrame(np.random.randn(1000,4))#print(data.describe())print(data[(np.abs(data)>3).any(1)])#超过3或者...

2018-04-04 21:10:27 842

原创 数据离散化和面元划分

from pandas import Seriesimport pandas as pdimport numpy as npage=[20,22,25,27,21,23,37,31,61,45,41,32]bins=[18,25,35,60,100]cats=pd.cut(age,bins)print(cats)print(cats.codes)#查看属于哪类count=pd.va...

2018-04-04 20:30:30 255

原创 利用函数或者映射进行数据转换

from pandas import Seriesimport pandas as pdimport numpy as npdata=pd.DataFrame({ "food":["bacon", "pulled pork", "bacon", "Pastrami", "corned be.

2018-04-04 18:51:40 414

原创 用python代码实现kmeans算法

import numpy as npydef kmeans(X,k,maxIteration): numpoint,numdim=X.shape numSet=npy.zeros((numpoint,numdim+1)) numSet[:,:-1]=X centroids=numSet[npy.random.randint(numpoint,size=k),:]...

2018-03-30 18:21:02 1299

原创 python实现回归中的相关系数和决定系数

import numpy as npyimport cmathdef computecorrelation(x,y): x_bar=npy.mean(x) y_bar=npy.mean(y) SSR=0 Varx=0 Vary=0 for i in range(0,len(x)): SSR+=(x[i]-x_bar)*(y[i]...

2018-03-28 19:11:23 8785

原创 多元线性回归案例

from numpy import genfromtxtimport numpy as npyfrom sklearn import datasets,linear_modelfilepath=r"G:\六西格玛\第一阶段-深度学习基础\代码与素材\代码与素材(2)\MachineLearning\MultiLinearRegression\Delivery.csv"data=genfro...

2018-03-28 10:01:23 2367

原创 多元线性回归1

import numpy as npyimport pandas as pdafrom sklearn import linear_modelfilepath="G:/Delivery.csv"data=pda.read_csv(filepath,encoding="gbk")print(data)x=data.iloc[:,0:2].as_matrix()y=data.iloc[:...

2018-03-28 09:46:56 229

原创 用python实现简单线性回归

import numpy as npydef fitSLR(x,y): fenzi = 0 fenmu = 0 num=len(x) for i in range(num): fenzi=fenzi+(x[i]-npy.mean(x))*(y[i]-npy.mean(y)) fenmu=fenmu+(x[i]-npy.mean(x)...

2018-03-27 20:17:33 505

原创 神经网络算法实现

import numpy as npydef tanh(x): return npy.tanh(x)def tanh_deriv(x): return 1.0-npy.tanh(x)**2def logistic(x): return 1/(1+npy.exp(-x))def logistic_deriv(x): return logistic(x)*(1...

2018-03-27 16:11:12 507

原创 利用python中的库实现knn分类

from sklearn import neighborsfrom sklearn import datasetsknn=neighbors.KNeighborsClassifier()iris=datasets.load_iris()print(iris)knn.fit(iris.data,iris.target)predictlabel=knn.predict([0.1,0.2,0.3,0.4...

2018-03-26 21:09:37 2483

原创 knn算法实现

from numpy import *import operatorfrom os import listdirdef knn(k,traindata,labels,testdata):    num=traindata.shape[0]    dif=tile(testdata,(num,1))-traindata    sqdif=dif**2    sqdifsum=sqdif.sum(ax...

2018-03-26 10:21:03 157

原创 用KNN算法识别黑白数字

from numpy import *import operatorfrom os import listdirdef knn(k,testdata,traindata,labels):    traindatasize=traindata.shape[0]    dif=tile(testdata,(traindatasize,1))-traindata    sqdif=dif**2    s...

2018-03-06 13:12:33 266

原创 文本挖掘--相似度对比

对比盗墓笔记、鬼吹灯和金九门的相似度import jiebafrom gensim import corpora, models, similaritiesimport urllib.requestfrom collections import defaultdict#下面我们使用phpstudy的服务器来打开txt文档doc1=urllib.request.urlopen("http://127...

2018-03-05 11:40:49 965

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除