- 博客(35)
- 收藏
- 关注
原创 用交叉验证调整KNN模型的参数
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np#加载数据def inspect_data(file_root): dataframe=pd.read_csv(file_root) print("数据基本信息:") print(dataframe.info()) pri...
2018-08-17 15:13:30
1628
原创 用SVM识别手写体案例
from sklearn import datasetsfrom sklearn import svmiris=datasets.load_iris()digits=datasets.load_digits()#选择SVM模型svm_classifier=svm.SVC(gamma=0.0001,C=100)#手动划分训练集,测试集n_test=100#测试数量train_x=d...
2018-08-16 16:07:04
689
原创 电影票房案例分析
import pandas as pd#加载数据def read_data(file_root): dataframe=pd.read_csv(file_root) print("数据的基本信息:") print(dataframe.info()) print("数据的行是%i,列是%i"%(dataframe.shape[0],dataframe.shape...
2018-08-15 22:02:31
1741
原创 星际争霸游戏战队案例分析
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#1.加载并查看数据基本信息def read_dataset(file_root): dataframe=pd.read_csv(file_root) print("数据的基本信息:") print(dataframe.info(...
2018-08-15 15:02:58
448
原创 BP人工神经网络案例
#BP人工神经网络实现#1.读取数据#2.导入keras.models Sequential /keras.layers.core Dense,Activation#3.Squential 建立模型#4.Dense 建立层#5.Activation激活函数#6.compile模型编译#7.fit训练(学习)#8.验证(测试,分类预测)import numpy as npim...
2018-08-14 10:45:21
979
原创 聚类K—means案例
import pandas as pdimport numpy as npimport matplotlib.pylab as pylfile_root="路径文件"dataframe=pd.read_csv(file_root)x=dataframe.ix[:,:].as_matrix()from sklearn.cluster import KMeansk_mean=KMean...
2018-08-13 09:59:34
617
原创 决策树ID3算法案例
import pandas as pdfile_root="G:/python/源码/源码/lesson.csv"dataframe=pd.read_csv(file_root,encoding="gbk")#print(dataframe)x=dataframe.ix[:,1:5].as_matrix()y=dataframe.ix[:,5].as_matrix()for i in...
2018-08-12 18:20:03
1183
原创 逻辑回归案例
import pandas as pdroot="G:/python/源码/源码/luqu.csv"dataframe=pd.read_csv(root)#print(dataframe)x=dataframe.ix[:,1:4]y=dataframe.ix[:,0]from sklearn.linear_model import LogisticRegressionmodel2=...
2018-08-12 14:09:44
1238
原创 朴素贝叶斯分类算法的实现
import numpy as npdef bayes(train_data,labels,test_data): train_data_num=len(train_data)#测试数据或类别长度 not_r_label=set(labels)#不重复的类别 label_rate={} for item in not_r_label: label...
2018-08-12 08:21:51
209
原创 SQL练习题
-- 9、 查询“95031”班的学生人数。select count(1) from student where class = 95031;-- 10、查询Score表中的最高分的学生学号和课程号。select sno, cno from score where degree = (select max(degree) from score );-- 11、查询‘3-105’号课程的平均分。se...
2018-05-26 21:26:48
271
原创 python连接mysql
import pymysqlconnection=Nonecursor=Nonetry: connection=pymysql.connect('localhost','root','root','test1') cursor = connection.cursor() sql = 'insert into dept values (%s,%s,%s)' tr...
2018-05-07 16:35:29
119
原创 SQL子查询
-- 子查询-- 子查询语句可以在select, from where 中-- 查询工资高于平均工资的雇员名字和工资。select ename, sal from emp where sal > (select avg(sal) as avg_sal from emp);-- 查询和scott同一部门且工资比他低的雇员名字和工资select t1.ename, t2.sal from emp...
2018-05-06 20:35:31
197
原创 SQL表连接
-- 表链接-- 内链接use test1;-- 第一中表示方式(没有外键约束的两张表一般使用第一种):select ename, dname from emp, dept where emp.deptno = dept.deptno;-- 第二种表示方式(有外键约束)select ename,dname from emp inner join dept on emp.deptno = dept....
2018-05-06 16:34:15
155
原创 SQL事务和表的关系
-- 事务create table t_account(id int(8) primary key,money double)-- rollback 是回滚即删除事务begin;update t_account set money=money-100 where id=1;update t_account set money=money+100 where id=2;COMMIT;-- 表的关系-...
2018-05-06 13:49:34
367
原创 SQL索引和视图
-- 创建emp表ename字段的索引create index i_emp_index on emp(ename);-- 删掉索引drop index i_emp_index;-- 创建一个视图create view v_emp as select empno,ename,job from emp;select * from v_emp limit 1;insert into v_emp valu...
2018-05-05 22:40:31
567
原创 SQL表的约束
-- emp表的emptno字段增加外键dept表的deptnoalter table emp add constraint foreign key (deptno) references dept (deptno);create table t_dept(id int(8) primary key,name varchar(200) not null,emp_max_count int(2) c...
2018-05-05 21:55:21
221
原创 SQL分组查询和过滤
-- 统计每个部门的平均工资,存在group by分组,select字句不能写group by没有的字段,除非这些用在聚合函数中select deptno,avg(sal) from emp group by deptno;-- 统计每个部门的人数,最高工资,最低工资,平均工资select count(0) as 人数, max(sal) as 最高工资, min(sal) as 最低工资,avg...
2018-05-05 14:46:24
1979
原创 SQL聚合函数和内置函数
use test1;-- 统计一共有多少个员工select count(*) from emp;select count(1) from emp;select count(empno) from emp;-- 工资最高的select max(sal) from emp;-- 平均工资select avg(sal) from emp;-- 字符串链接的函数select CONCAT(ename,'的...
2018-05-05 11:33:57
665
原创 SQL语句之select
-- 查询emp的所有数据select * from emp;-- 指定字段进行查询select empno, job, ename from emp;-- 查询所有员工的年薪select ename,sal*12 as 年薪 from emp;-- 别名使用 as,as 可以省略select ename,sal*12 年薪 from emp;-- 去重select distinct deptno...
2018-05-04 15:19:30
179
原创 SQL语法之DDL
-- 创建表create table t_student(id int(8) PRIMARY KEY,grade int(8) not null,address varchar(200) not null UNIQUE);-- 删除表drop table t_student;-- 在表中添加一个新字段alter table t_person add grade int(8) DEFAULT 0;-...
2018-05-04 13:21:35
150
原创 Series和DataFrame的柱状图
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pandas import Seriesfrom pandas import DataFrame#Series画柱状图fig,axes=plt.subplots(2,1)#两行一列data=Series(np.random.rand(16)...
2018-04-05 20:42:54
3590
原创 用matplotlib设置标题、轴标签、刻度标签以及添加图例
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfig=plt.figure()ax=fig.add_subplot(1,1,1)ax.plot(np.random.randn(1000).cumsum())x_ticks=ax.set_xticks([0,250,500,750,1000])x_...
2018-04-05 16:39:21
26138
原创 检测和过滤异常值
from pandas import Seriesimport pandas as pdimport numpy as np#np.random.seed(12345)data=pd.DataFrame(np.random.randn(1000,4))#print(data.describe())print(data[(np.abs(data)>3).any(1)])#超过3或者...
2018-04-04 21:10:27
842
原创 数据离散化和面元划分
from pandas import Seriesimport pandas as pdimport numpy as npage=[20,22,25,27,21,23,37,31,61,45,41,32]bins=[18,25,35,60,100]cats=pd.cut(age,bins)print(cats)print(cats.codes)#查看属于哪类count=pd.va...
2018-04-04 20:30:30
255
原创 利用函数或者映射进行数据转换
from pandas import Seriesimport pandas as pdimport numpy as npdata=pd.DataFrame({ "food":["bacon", "pulled pork", "bacon", "Pastrami", "corned be.
2018-04-04 18:51:40
414
原创 用python代码实现kmeans算法
import numpy as npydef kmeans(X,k,maxIteration): numpoint,numdim=X.shape numSet=npy.zeros((numpoint,numdim+1)) numSet[:,:-1]=X centroids=numSet[npy.random.randint(numpoint,size=k),:]...
2018-03-30 18:21:02
1299
原创 python实现回归中的相关系数和决定系数
import numpy as npyimport cmathdef computecorrelation(x,y): x_bar=npy.mean(x) y_bar=npy.mean(y) SSR=0 Varx=0 Vary=0 for i in range(0,len(x)): SSR+=(x[i]-x_bar)*(y[i]...
2018-03-28 19:11:23
8785
原创 多元线性回归案例
from numpy import genfromtxtimport numpy as npyfrom sklearn import datasets,linear_modelfilepath=r"G:\六西格玛\第一阶段-深度学习基础\代码与素材\代码与素材(2)\MachineLearning\MultiLinearRegression\Delivery.csv"data=genfro...
2018-03-28 10:01:23
2367
原创 多元线性回归1
import numpy as npyimport pandas as pdafrom sklearn import linear_modelfilepath="G:/Delivery.csv"data=pda.read_csv(filepath,encoding="gbk")print(data)x=data.iloc[:,0:2].as_matrix()y=data.iloc[:...
2018-03-28 09:46:56
229
原创 用python实现简单线性回归
import numpy as npydef fitSLR(x,y): fenzi = 0 fenmu = 0 num=len(x) for i in range(num): fenzi=fenzi+(x[i]-npy.mean(x))*(y[i]-npy.mean(y)) fenmu=fenmu+(x[i]-npy.mean(x)...
2018-03-27 20:17:33
505
原创 神经网络算法实现
import numpy as npydef tanh(x): return npy.tanh(x)def tanh_deriv(x): return 1.0-npy.tanh(x)**2def logistic(x): return 1/(1+npy.exp(-x))def logistic_deriv(x): return logistic(x)*(1...
2018-03-27 16:11:12
507
原创 利用python中的库实现knn分类
from sklearn import neighborsfrom sklearn import datasetsknn=neighbors.KNeighborsClassifier()iris=datasets.load_iris()print(iris)knn.fit(iris.data,iris.target)predictlabel=knn.predict([0.1,0.2,0.3,0.4...
2018-03-26 21:09:37
2483
原创 knn算法实现
from numpy import *import operatorfrom os import listdirdef knn(k,traindata,labels,testdata): num=traindata.shape[0] dif=tile(testdata,(num,1))-traindata sqdif=dif**2 sqdifsum=sqdif.sum(ax...
2018-03-26 10:21:03
157
原创 用KNN算法识别黑白数字
from numpy import *import operatorfrom os import listdirdef knn(k,testdata,traindata,labels): traindatasize=traindata.shape[0] dif=tile(testdata,(traindatasize,1))-traindata sqdif=dif**2 s...
2018-03-06 13:12:33
266
原创 文本挖掘--相似度对比
对比盗墓笔记、鬼吹灯和金九门的相似度import jiebafrom gensim import corpora, models, similaritiesimport urllib.requestfrom collections import defaultdict#下面我们使用phpstudy的服务器来打开txt文档doc1=urllib.request.urlopen("http://127...
2018-03-05 11:40:49
965
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人