Python
文章平均质量分 70
飘的心
这个作者很懒,什么都没留下…
展开
-
python.numpy的简单学习
>>> import numpy as np>>> >>> a1=np.arange(0,16,2) #生成数组,第一个值是起始值,第二个值是结束值,第三个是差值,a1 #第一个、第三个值可以省略,但是第二个值必须有,如果只有第三个,则起点为0,差值为1>>> a2=np.linspace(0,1,100) #生成等差序列,起始值为0,结束值为1原创 2017-08-16 10:37:28 · 243 阅读 · 0 评论 -
Python进行参数调优GridSearchCV和RandomizedSearchCV
# -*- coding: utf-8 -*-"""Created on Wed Sep 6 14:30:24 2017@author: 飘的心"""from sklearn.datasets import load_digitsfrom sklearn.linear_model import LogisticRegressionfrom sklearn.model_selec原创 2017-09-06 15:27:25 · 12174 阅读 · 0 评论 -
python实现自编码器autoencode
# -*- coding: utf-8 -*-"""Created on Sun Sep 3 13:48:19 2017@author: piaodexin"""from __future__ import division, print_function, absolute_importimport tensorflow as tffrom tensorflow.exampl原创 2017-09-03 16:59:02 · 9451 阅读 · 2 评论 -
sklean中交叉检验和混淆矩阵
'''今天学习到的东西,、很重要'''#cross_validationfrom sklearn import cross_validationx_train,x_test,y_train,x_test=cross_validation(x,y,test_size=0.25, random_state=0,stratify=y原创 2017-09-05 17:18:36 · 3796 阅读 · 1 评论 -
Python实现Adaboost(decisiontree)
from sklearn import datasetsfrom sklearn.svm import LinearSVCfrom sklearn import ensemblefrom sklearn.model_selection import validation_curveimport matplotlib.pyplot as pltimport numpy as npdat原创 2017-09-07 17:57:30 · 1150 阅读 · 0 评论 -
Python实现感知器
# -*- coding: utf-8 -*-"""Created on Fri Sep 1 11:56:12 2017@author: piaodexin"""#import pandas as pdimport numpy as np#生成正标签数据x1=np.random.randn(50,2)+40y1=np.ones((50,1))data1=np.hstack原创 2017-09-01 14:45:39 · 1037 阅读 · 0 评论 -
Python将数据写入netCDF4中
'''输入的data的shape=(627,652)'''def write_to_nc_canque(data,file_name_path): import netCDF4 as nc lonS=np.linspace(119.885,120.536,652) latS=np.linspace(29.984,29.358,627) da=nc.Datase原创 2017-09-01 14:52:01 · 11153 阅读 · 1 评论 -
pthon连接mysql和sqlserver
import pymysqlconn=pymsql.connect(host=host0,user=uid0,password=pwd0,database=db0,charset='utf-8')cur=conn.cursor()cur.excute('insert into table(...) values(...)')#插入数据conn.commit() #原创 2017-08-24 15:57:14 · 284 阅读 · 0 评论 -
对糖尿病数据进行PCA降维
from sklearn import datasets #加载数据集from sklearn import decompositiondata=datasets.load_diabetes() data=data.datajiangwei=decomposition.PCA(n_components=4) #提取四个主成分jiangwei.fit(data)jiangwe原创 2017-09-01 15:15:43 · 1117 阅读 · 0 评论 -
Python中学习器流水线Pipeline
'''sklean提供的pipeline来将多个学习器组成流水线,通常流水线的形式为:将数据标准化的学习器---特征提取的学习器---执行预测的学习器除了最后一个学习器之外,前面的所有学习器必须提供transform方法,该方法用于数据转化(例如: 归一化,正则化,以及特征提取'''from sklearn.datasets import load_digitsfro原创 2017-09-01 16:25:48 · 17100 阅读 · 2 评论 -
Python进行特征提取
# -*- coding: utf-8 -*-"""Created on Mon Aug 21 10:57:29 2017@author: 飘的心"""#过滤式特征选择#根据方差进行选择,方差越小,代表该属性识别能力很差,可以剔除from sklearn.feature_selection import VarianceThresholdx=[[100,1,原创 2017-08-21 17:11:07 · 15044 阅读 · 3 评论 -
python学习learning_curve和validation_curve
learning_curve是展示不同数据量,算法学习得分validation_curve是展示某个因子,不同取值的算法得分# -*- coding: utf-8 -*-"""Created on Wed Sep 06 09:55:13 2017@author: 飘的心"""from sklearn.model_selection import learning_curve原创 2017-09-06 11:37:00 · 8450 阅读 · 0 评论 -
Python实现CART,并且展示混淆矩阵
# -*- coding: utf-8 -*-"""Created on Tue Sep 5 16:18:15 2017@author: piaodexin"""from sklearn import datasetsfrom sklearn import cross_validationfrom sklearn.tree import DecisionTreeClassifi原创 2017-09-05 16:36:55 · 1114 阅读 · 0 评论 -
Python实现KMeans聚类
from sklearn import datasets #加载数据包from sklearn.cluster import KMeans #加载KMeansfrom sklearn import cross_validation #加载交叉检验,然后处理数据data=datasets.load_iris()x=data.datay=data.targetx_train,x_t原创 2017-09-05 14:46:12 · 597 阅读 · 0 评论 -
python实现神经网络
# -*- coding: utf-8 -*-"""Created on Sun Jul 30 18:23:26 2017@author: r"""import randomimport mathrandom.seed(0)def rand(a,b): return (b-a)*random.random()+adef make转载 2017-08-17 00:34:08 · 509 阅读 · 0 评论 -
Python进行数据处理
# -*- coding: utf-8 -*-"""Created on Thu Aug 17 17:15:14 2017@author: cq"""#二元化from sklearn.preprocessing import Binarizerx=[[1,2,3,4,5], [5,4,3,2,1], [3,3,3,3,3], [1,1,1原创 2017-08-17 18:02:26 · 449 阅读 · 0 评论 -
大批量导入数据到mysql中
#大量导入数据进入MySQLimport pymysqlconn=pymysql.connect(host=host0,user=uid0,password=pwd0,database=db0,charset="utf8")cur=conn.cursor()tt='insert into kuqu(id,name,shuliang) values 'for i,a in enu原创 2017-08-18 10:46:36 · 403 阅读 · 0 评论 -
用python写xml文件
info=[{'id':1,'name':'wang','age':10,'major':'math'}, {'id':2,'name':'zhang','age':11,'major':'statistic'}, {'id':3,'name':'shan','age':18,'major':'english'}, {'id':4,'name':'chen原创 2017-08-18 11:46:19 · 793 阅读 · 0 评论 -
Python读取与更改xml文件
'''原始文档内容 path="/tmp"> output_formatter="OutPutFormatt转载 2017-08-18 16:05:16 · 10311 阅读 · 1 评论 -
Python学习异常检测
# -*- coding: utf-8 -*-"""Created on Mon Aug 21 14:11:22 2017@author: cq"""#python处理异常try : 2/0except Exception,e: #其中e为实例,即错误的实况 print(e) try: a原创 2017-08-21 18:05:35 · 1093 阅读 · 0 评论 -
浅谈广义线性回归
首先,广义线性模型是基于指数分布族的,而指数分布族的原型如下 其中为自然参数,它可能是一个向量,而叫做充分统计量,也可能是一个向量,通常来说。 实际上线性最小二乘回归和Logistic回归都是广义线性模型的一个特例。当随机变量服从高斯分布,那么 得到的是线性最小二乘回归,当随机变量服从伯努利分布,则得到的是Logistic回归。 那么如原创 2017-08-22 11:06:12 · 7442 阅读 · 0 评论 -
softmax回归
在分类中,我们会碰到二分类,这个时候我们就可以使用logistic回归,然后多分类的任务在现实中才是常见的,例如让你分类某一个电影属于哪一类,以及文章类型属于哪一类,这个时候我们就需要softmax回归。 在Logistic回归中,样本数据的值,而在softmax回归中,其中是类别种数,比如在分析电影类别时中,表示要识别的10种类型的电影。设原创 2017-08-22 11:26:24 · 615 阅读 · 0 评论 -
画饼图
"""===============Basic pie chart===============Demo of a basic pie chart plus a few additional features.In addition to the basic pie chart, this demo shows a few optional features:原创 2017-08-22 14:46:24 · 524 阅读 · 0 评论 -
python增加xml文件节点
from xml.etree.ElementTree import ElementTree,Elementtree=ElementTree()tree.parse('D://myself.xml')#下面主要是在根目录里加一级目录#2得到根目录root=tree.getroot()#创建一级目录element=Element('train',{'name':'w原创 2017-08-18 16:29:13 · 19959 阅读 · 5 评论 -
抓取360图片
"""Created on Tue Apr 18 12:47:50 2017@author: 飘的心"""import requestsfrom bs4 import BeautifulSoupimport jsonimport osdef load_img(key): url='http://image.so.com/i?ie=utf-8&src=hao_360so原创 2017-09-01 16:45:37 · 1062 阅读 · 0 评论