python学习
JiangCaifu
这个作者很懒,什么都没留下…
展开
-
C4_week1
import numpy as npimport h5pyimport matplotlib.pyplot as pltplt.rcParams['figure.figsize']=(5.0,4.0)plt.rcParams['image.interpolation']='nearest'plt.rcParams['image.cmap']='gray'np.random.seed(...转载 2019-07-02 18:07:37 · 187 阅读 · 0 评论 -
定义神经网络
from __future__ import print_functionimport torch as timport torch.nn as nnimport torch.nn.functional as Ffrom torch.autograd import Variableclass Net(nn.Module): def __init__(self):#构造函数 ...原创 2019-04-22 20:53:15 · 647 阅读 · 0 评论 -
贝叶斯实现拼写检查器
贝叶斯实现拼写检查器import re,collectionsdef words(text):return re.findall('[a-z]+',text.lower())def train(features): model=collections.defaultdict(lambda:1) for f in features: model[f]+=1...原创 2019-03-22 10:26:43 · 258 阅读 · 0 评论 -
SMOTE样本生成策略
import pandas as pdfrom imblearn.over_sampling import SMOTEfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import confusion_matrixfrom sklearn.model_selection import train...原创 2019-03-12 10:18:50 · 738 阅读 · 0 评论 -
分类算法分析船员数据
数据预处理import pandastitanic=pandas.read_csv("titanic_train.csv")print(titanic.describe())titanic['Age']=titanic['Age'].fillna(titanic['Age'].median())print(titanic.describe())print(titanic['Sex'...原创 2019-03-20 14:57:24 · 276 阅读 · 0 评论 -
逻辑回归模型的评估与建立
模型评估方法import pandas as pdimport matplotlib.pyplot as pltimport numpy as npdata=pd.read_csv("creditcard.csv")print(data.head())count_classes=pd.value_counts(data['Class'],sort=True).sort_index(...原创 2019-03-11 14:49:04 · 548 阅读 · 0 评论 -
决策树
决策树的构造与涉及参数树模型参数:1.criteration gini or entropy2.spliter best (默认)or random3.max features None4.max_detph5.min_sample_split(小于某个值的时候不再分裂)6.min_sample_leaf(叶子节点最小的样本数,小于该数则剪枝)7.min_weigh...原创 2019-03-15 10:31:42 · 235 阅读 · 0 评论 -
交叉验证
from sklearn.model_selection import train_test_split#Whole dataset#切分:切分时先进行洗牌的操作再切分X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=0)print("Number transactions trai...原创 2019-03-07 16:24:31 · 294 阅读 · 0 评论 -
逻辑回归的实例
案例背景和目标import pandas as pdimport matplotlib.pyplot as pltimport numpy as npdata=pd.read_csv("creditcard.csv")print(data.head())样本不均衡解决方案count_classes=pd.value_counts(data['Class'],sort=Tru...原创 2019-03-07 11:14:41 · 848 阅读 · 0 评论 -
用Variable实现线性回归
import torch as tfrom torch.autograd import Variable as Vimport matplotlib.pyplot as pltfrom IPython import display#设置随机数种子t.manual_seed(1000)def get_fake_data(batch_size=8): '''产生随机数据:y=x...原创 2019-04-27 22:12:59 · 317 阅读 · 0 评论 -
CIFAR-10分类
import torch as timport torchvision as tvimport torchvision.transforms as transformsfrom torchvision.transforms import ToPILImageimport matplotlib.pyplot as pltshow=ToPILImage() #可以把Tensor转为Imag...原创 2019-04-23 16:40:49 · 1495 阅读 · 0 评论 -
C2_week2
import numpy as npimport matplotlib.pyplot as pltimport scipy.ioimport mathimport sklearnimport sklearn.datasetsimport opt_utilsimport testCaseplt.rcParams['figure.figsize']=(7.0,4.0)#set def...转载 2019-07-01 20:27:17 · 204 阅读 · 0 评论 -
Course1-第四周作业
import numpy as npimport h5pyimport matplotlib.pyplot as pltimport testCasesfrom dnn_utils import sigmoid,sigmoid_backward,relu,relu_backwardimport lr_utilsnp.random.seed(1)#初始化参数#对于两层的网络结构而言...转载 2019-06-25 16:54:06 · 325 阅读 · 0 评论 -
吴恩达课后编程作业:第三周检测
import numpy as npimport matplotlib.pyplot as pltfrom testCases import *import sklearnimport sklearn.datasetsimport sklearn.linear_modelfrom planar_utils import plot_decision_boundary,sigmoid,l...转载 2019-06-17 22:13:44 · 732 阅读 · 0 评论 -
Course 1 - 神经网络和深度学习 - 第二周作业
import numpy as npimport matplotlib.pyplot as pltimport h5pyfrom lr_utils import load_dataset#lr_utils和dataset在代码文件的同一级目录下#把数据加载到主程序i#np.squeeze的目的,压缩维度#只有压缩后的值才能进行解码操作itrain_set_x_orig,train_...转载 2019-06-13 20:30:37 · 333 阅读 · 0 评论 -
Pytorch中的常用工具
1.定义自己的数据集#1.处理数据,定义自己的数据集import torch as tfrom torch.utils import dataimport osfrom PIL import Imageimport numpy as npclass DogCat(data.Dataset): def __init__(self,root): imgs=os...原创 2019-05-17 21:46:07 · 918 阅读 · 0 评论 -
实现ResNet
from torch import nnimport torch as tfrom torch.nn import functional as Fclass ResidualBlock(nn.Module): ''' 实现子module:Residual Block ''' def __init__(self,inchannel,outchannel,str...原创 2019-05-10 16:14:28 · 257 阅读 · 0 评论 -
常用的神经网络层
图像相关层import torch as tfrom torch import nnfrom PIL import Imagefrom torch.autograd import Variable as Vfrom torchvision.transforms import ToTensor, ToPILImageto_tensor=ToTensor() #img->tens...原创 2019-05-07 20:40:21 · 744 阅读 · 0 评论 -
nn.Module
#继承nn.Module撰写自己的全连接层import torch as tfrom torch import nnfrom torch.autograd import Variable as Vclass Linear(nn.Module):#继承nn.Module def __init__(self,in_features,out_features): sup...原创 2019-04-28 17:32:36 · 694 阅读 · 0 评论 -
seaborn变量分析
单变量分析import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import integrate, statsimport seaborn as snssns.set(color_codes=True)np.random.seed(sum(map(ord,"distribution...原创 2019-02-27 10:42:34 · 188 阅读 · 0 评论 -
梯度下降求解逻辑回归
导入数据import pandas as pdimport matplotlib.pyplot as pltimport ospath='data'+os.sep+'LogiReg_data.txt'pdData=pd.read_csv("LogiReg_data.txt",names=['Exam 1','Exam 2', ...原创 2019-03-05 15:07:17 · 477 阅读 · 3 评论 -
FacetGrid多变量的绘制
多变量的绘制import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import integrate, statsimport seaborn as snssns.set(style="whitegrid",color_codes=True)tips=sns.load_datas...原创 2019-02-28 14:46:21 · 250 阅读 · 0 评论 -
透视表
透视表代码示例import numpy as npimport pandas as pdfrom pandas import Series,DataFramedf=pd.read_csv("city_weather.csv.csv")print(df)#生成透视表print(pd.pivot_table(df,index=['city','wind']))print(pd.pivo...原创 2018-12-04 10:56:46 · 171 阅读 · 0 评论 -
数据技术
数据分箱技术import numpy as npimport pandas as pdfrom pandas import Series,DataFramescore_list=np.random.randint(25,100,size=20)print(score_list)bins=[0,59,70,80,90]score_cat=pd.cut(score_list ,bins)...原创 2018-12-04 10:19:06 · 184 阅读 · 0 评论 -
Numpy攻略:确定稳态
马尔可夫链:被用来描述至少有两个状态的系统,指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。此类系统t时刻的状态仅取决于t-1时刻的状态。稳态:在未来某个时刻之后或者从理论上讲经过无限长时间之后,马尔可夫链系统的状态将不再改变,这个状态被称为稳态。随机矩阵包含了状态之间转移的概率,...原创 2018-11-08 20:13:35 · 808 阅读 · 0 评论 -
Numpy攻略:寻找最大回文数
回文数指从左往右读和从右往左读都一样的数字,我们寻找由两个三位数相乘而获得的最大回文数。具体步骤:1.创建一个由三位数构成的数组用numpy.testing包中的assert_equal函数,检查数组中的第一个元素和最后一个元素是否正确。2.创建乘积数组创建一个数组,用来存放所有的可能的三位数的乘积。outer函数:实现外积运算sort方法:确保数组元素已经正确的排序之后,做一些正...原创 2018-11-02 14:03:41 · 645 阅读 · 0 评论 -
Numpy攻略:用埃氏筛筛选
埃氏筛:筛选质数的一种算法,用迭代的方式识别出已经找到的质数的倍数,能高效地筛选出小于一千万的质数。让我们去试着寻找10001个质数。具体步骤如下:1.创建一个连续的整数列表:用arange函数2.筛选出p的倍数完整代码如下图: import numpyLIM=10**6N=10**9P=10001primes=[]p=2#通过列出前6个质数:2,3,5,7,11,13,...原创 2018-11-09 15:52:33 · 306 阅读 · 0 评论 -
Numpy攻略:模拟在随机时间点
具体步骤:1.生成随机索引:用randint函数生成随机整数2.模拟交易过程:用Numpy的take函数,从收盘价数组中选取若干函数。3.绘制利润直方图完整代码如下:...原创 2018-11-09 14:47:58 · 267 阅读 · 0 评论 -
Numpy攻略:发现幂律
幂律分布:用于描述财富的不均匀性,即富翁的精英所占的都很少。具体步骤:1.提取正的收益率数据:计算收盘价的对数并且对结果进行差分运算,之后从收益率数据中,选出正值。2.获取收益率的收益频率:使用histogram函数,获得收益率的出现频率。分组计算,并返回一个包含各组计数值的数组。3.利用频数值和收益率数据拟合直线:使用ployfit拟合直线4.使用Matplotlib绘制出结果数据和拟...原创 2018-11-09 10:12:08 · 1303 阅读 · 0 评论 -
Numpy攻略:寻找质因
Fermat因式分解法基本思路:用如下公式把N分成c和d两个整数:递归地应用这个因式分解法,直到得到需要的质因数。具体步骤:1.创建尝试值数组:用ceil函数对其输入的参数的数组元素向上取整(选择大于等于x的最小整数)。2.得到数组b的小数部分:检查数组b2中的元素是否为某个数的平方modf函数:可以获得数组的小数部分3.查找小数部分为0的数组元素使用where函数,获取数组...原创 2018-11-01 22:59:01 · 565 阅读 · 0 评论 -
python
矩阵的创建与元素的访问import numpy as np#create from python_listlist_1=[1,2,3,4]print(list_1)array_1=np.array(list_1)print(array_1)list_2=[5,6,7,9]array_2=np.array([list_1,list_2])print(array_2)print(a...原创 2018-11-27 23:58:19 · 118 阅读 · 0 评论 -
数组与矩阵
import numpy as np#创建随机数组a1=np.random.randn(10)print(a1)#创建二维数组b1=np.random.randint(10,size=20).reshape(4,5)print(b1)#数组运算a2=np.random.randint(10,size=20).reshape(4,5)b2=np.random.randint(10,...原创 2018-11-28 11:28:03 · 186 阅读 · 0 评论 -
FacetGrid函数
FacetGrid的使用方法import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import integrate, statsimport seaborn as snssns.set(style="wegrid",color_codes=True)tips=sns.load_...原创 2019-02-28 10:19:12 · 1480 阅读 · 0 评论 -
seaborn
seaborn实现直方图和密度图import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFrameimport seaborn as snss1=Series(np.random.randn(1000))sns.distplot(s1,hist=...原创 2018-12-06 11:46:57 · 168 阅读 · 0 评论 -
时间序列
时间序列的基本操作import numpy as npimport pandas as pdfrom pandas import DataFrame,Seriesfrom datetime import datetimet1=datetime(2009,10,20)print(t1)date_list=[ datetime(2016,9,1), datetime(20...原创 2018-12-03 16:57:09 · 159 阅读 · 0 评论 -
直方图和密度图
直方图import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFrame#直方图s=Series(np.random.randn(1000))#绘制直方图plt.hist(s)plt.show()a=np.arange(10)print(...原创 2018-12-05 14:42:21 · 844 阅读 · 0 评论 -
pandas 绘图
Series绘图import numpy as npimport pandas as pdfrom pandas import Seriesimport matplotlib.pyplot as plts1=Series(np.random.randn(1000)).cumsum()s2=Series(np.random.randn(1000)).cumsum()s1.plot()...原创 2018-12-05 13:47:59 · 145 阅读 · 0 评论 -
Matplotlib
plot的用法import numpy as npimport matplotlib.pyplot as plta=[1,2,3]b=[4,5,6]print(plt.plot(a,b))c=[10,8,6]d=[1,8,3]t=np.arange(0.0,2.0,0.1)print(t.size)s=np.sin(t*np.pi)print(s.size)#让图像显示出来...原创 2018-12-05 10:40:09 · 110 阅读 · 0 评论 -
Series和DataFrame的
reindex函数原创 2018-12-03 10:22:16 · 148 阅读 · 0 评论 -
Pandas
Pandas的Series库import numpy as npimport pandas as pdfrom pandas import Series,DataFrame#通过list创建Seriess1=pd.Series([1,2,3,4])print(s1)print(s1.values)print(s1.index)#通过arang创建s2=pd.Series(np....原创 2018-11-28 17:05:15 · 125 阅读 · 0 评论