python 学习
文章平均质量分 65
liulina603
治疗对未来焦虑的良药就在今天你自己的所为
展开
-
baidu接口使用
1、如何使用百度接口https://ai.baidu.com/tech/nlp/dnnlm_cn应用列表中–》创建应用—>会生成一个新创建的应用,生成AK,SK ![在这里插入图片描述](https://img-blog.csdnimg.cn/20191211092211178.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5na...原创 2019-12-11 09:23:59 · 385 阅读 · 0 评论 -
xgboost 调参经验
1.xgboost 基本方法和默认参数在训练过程中主要用到两个方法:xgboost.train()和xgboost.cv().#xgboost.train()APIxgboost.train(params,dtrain,num_boost_round=10,evals=(),obj=None,feval=None,maximize=False,early_stopping_r转载 2017-12-01 16:03:10 · 6613 阅读 · 1 评论 -
python读取excel中单元格的内容返回的5种类型
文章转自:https://www.cnblogs.com/xxiong1031/p/7069006.htmlpython读取excel中单元格的内容返回的有5种类型,即上面例子中的ctype:ctype: 0 empty1 string2 number3 date4 boolean5 error#转载 2018-01-26 13:00:05 · 19529 阅读 · 0 评论 -
python中的list和array的不同、from…import
python中的list是python的内置数据类型,list中的数据类不必相同的,而array的中的类型必须全部相同。在list中的数据类型保存的是数据的存放的地址,简单的说就是指针,并非数据,这样保存一个list就太麻烦了例如list1=[1,2,3,'a']需要4个指针和四个数据,增加了存储和消耗cpu。1、numpy中封装的array有很强大的功能,里面原创 2017-11-30 09:59:01 · 6472 阅读 · 1 评论 -
模型评价指标
一、分类评价指标1、对数损失函数(Log-loss) 在分类输出中,若输出不再是0-1,而是实数值,即属于每个类别的概率,那么可以使用Log-loss对分类结果进行评价。这个输出概率表示该记录所属的其对应的类别的置信度。比如如果样本本属于类别0,但是分类器则输出其属于类别1的概率为0.51,那么这种情况认为分类器出错了。该概率接近了分类器的分类的边界概率0.5。Log-loss是一个转载 2017-12-26 13:23:42 · 39904 阅读 · 0 评论 -
解决:ImportError: No module named 'xxxx'-------python中关于import语句
我用的 python 3.5 1、解决方法如下:try: # for Python2 from Tkinter import * except ImportError: # for Python3 from tkinter import *通过上面的方法就可以正确导入tkinter模块了,最新版本Tkinter要全部小写成tkinter才行原创 2018-02-05 09:34:01 · 8392 阅读 · 0 评论 -
c++加载python模块,但是PyImport_ImportModule老返回NULL
问题描述: 调用 PyImport_ImportModule加载python老是返回NULL,如下所示:“没有找到符号” 解决办法:import某块返回值为0的是因为:VC工程的当前工作目录和.py文件所在目录不一致导致的。当.py文件和工程不在统一目录时,若要import .py文件,只需要在import之前增加python的搜索目录就可以了: PyRun_SimpleString("imp...原创 2018-03-05 09:41:46 · 9940 阅读 · 6 评论 -
Tensorflow学习 及 函数、参数说明
TensorFlow学习笔记(1)----基础概念和程序的形式1.概念graph:图,表示具体的计算任务session:会话,图需要在会话中执行,一个会话可以包含很多图graph只是定义了计算,他本身不计算任何东西,他不保存任何值,他只是定义了你用代码所规定的操作session允许计算图或者图的一部分,他为这个分配资源并且保存中间结果的值和变量tensor:张量,在此表示数据,类型是numpy::...原创 2018-03-28 09:11:52 · 1955 阅读 · 0 评论 -
python的pip如何更新到最新版本
python -m pip install --upgrade pip原创 2018-04-13 16:04:46 · 1049 阅读 · 0 评论 -
os.walk() 在windows 和linux 上遍历不一样
1、如下代码在windows 上是按名字排序的,但在linux 上是乱序,不知道是按什么排的 #/usr/bin/python#-*-coding:utf-8-*-# 把名字修改并排序import osfrom sys import argvfrom nt import chdirsortId = 1 #刚开始从000001开始# globalpath = 'E:\Python...原创 2018-04-19 13:02:00 · 3187 阅读 · 2 评论 -
linux 服务器没有GUI时如何使用matplotlib绘图
需添加:import matplotlib as mplmpl.use('Agg')而且必须添加在import matplotlib.pyplot之前,否则无效最后在要保存的位置加上: plt.figure(num=1, figsize=(12, 8))plt.imshow(image_np)# plt.show() #这句是显示检测好的图片。如果加这句,下面的保存图片时,会是空图,不回,保...原创 2018-05-09 16:59:20 · 7885 阅读 · 4 评论 -
深度学习: 学习率 (learning rate)
深度学习: 学习率 (learning rate)Introduction学习率 (learning rate),控制 模型的 学习进度 : lr 即 stride (步长) ,即反向传播算法中的 ηη :ωn←ωn−η∂L∂ωnωn←ωn−η∂L∂ωn学习率大小 学习率 大 学习率 小 学习速度 快 慢 使用时间点 刚开始训练时 ...原创 2018-06-07 09:34:52 · 6727 阅读 · 1 评论 -
sklearn分类器、数据集的划分
大致可以将这些分类器分成两类: 1)单一分类器,2)集成分类器一、单一分类器下面这个例子对一些单一分类器效果做了比较# coding=utf-8from sklearn.cross_validation import cross_val_scorefrom sklearn.datasets import make_blobs# meta-estimatorfr转载 2017-12-28 13:52:09 · 2450 阅读 · 0 评论 -
交叉验证 Cross-validation
交叉验证(CrossValidation)方法思想简介以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(mo转载 2017-12-21 16:24:44 · 6551 阅读 · 5 评论 -
adaboost、bagging、boosting的区别
1、AdaBoost:提高那些被前一轮弱分类器错误分类样本的权值,而降低那些被正确分类样本的权值。这样一来,那些没有得到正确分类的数据,由于其权值的加大而受到后一轮的弱分类器的更大关注,于是,分类问题就被一系列的弱分类器“分而治之”。至于第二个问题,即弱分类器的组合,AdaBoost采取加权多数表决的方法。具体地,加大分类误差率小的弱分类器的权值,使其在表决中起较大的作用,减小分类误差率较大的转载 2017-12-07 16:17:09 · 11291 阅读 · 4 评论 -
逻辑回归(Logistic Regression)
一、什么是逻辑回归 机器学习算法三要素:模型、参数、目标函数。 1.模型 设X是连续随机变量,x服从logistic分布是指其具有下列分布函数和密度函数:F(x)=P(x≤x)=11+e−(x−u)/γf(x)=F′(x)=e−(x−u)/γγ(1+e−(x−u)/γ)2 逻辑回归模型是如下的概率分布:P(y=1|x)=e(原创 2017-11-30 15:25:58 · 146805 阅读 · 1 评论 -
numpy np.repeat 与 np.tile的区别, numpy.ravel()函数
二者执行的是均是复制操作;np.repeat:复制的是多维数组的每一个元素;np.tile:复制的是多维数组本身;1. np.repeatx = np.arange(1, 5).reshape(2, 2)print xprint np.repeat(x, 2)print np.tile(x,(5,1))print np.tile(x,(5,))结果:[[1 2]原创 2017-11-30 13:54:13 · 2275 阅读 · 1 评论 -
七种回归技术
什么是回归分析?回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详转载 2017-12-11 10:00:42 · 669 阅读 · 0 评论 -
pandas:填充缺失值 fillna("missing") 和fillna("missing",inplace=True)的区别
当数据中存在NaN缺失值时,我们可以用其他数值替代NaN,主要用到了DataFrame.fillna()方法,下面我们来看看具体的用法:1.先来创建一个带有缺失值的DataFrame:import pandas as pd import numpy as np df=pd.DataFrame(np.random.randn(5,3),index=list('abcde'),原创 2017-12-12 14:55:53 · 15484 阅读 · 0 评论 -
pandas的factorize(),numpy库unique函数
factorize函数可以将Series中的标称型数据映射称为一组数字,相同的标称型映射为相同的数字。factorize函数的返回值是一个tuple(元组),元组中包含两个元素。第一个元素是一个array,其中的元素是标称型元素映射为的数字;第二个元素是Index类型,其中的元素是所有标称型元素,没有重复。# coding=utf-8import numpy as np原创 2017-12-12 16:15:22 · 4367 阅读 · 1 评论 -
给numpy矩阵添加一列
首先我们有一个数据是一个mn的numpy矩阵现在我们希望能够进行给他加上一列变成一个m(n+1)的矩阵import numpy as npa = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.ones(3)c = np.array([[1,2,3,1],[4,5,6,1],[7,8,9,1]])PRint(a)print(b)print(c)原创 2017-12-15 16:03:38 · 3694 阅读 · 1 评论 -
Python下的机器学习工具scikit-learn --数据预处理
1. 标准化Standardization(这里指移除均值和方差标准化) 标准化是很多数据分析问题的一个重要步骤,也是很多利用机器学习算法进行数据处理的必要步骤。1.1 z-score标准化 z-score标准化指的是将数据转化成均值为0方差为1的高斯分布,也就是通常说的z-score标准化,但是对于不服从标准正态分布的特征,这样做效果会很差。在实际应用中,我们经常忽视原创 2017-12-13 14:02:07 · 773 阅读 · 0 评论 -
Python_pandas 两种主要的数据类型(Series、DataFrame)
1、一列字符转成数字,转后成一行了df2=DataFrame([{'A':'11','B':'12'},{'A':'111','B':'121'},{'A':'1111','B':'1211'}])numbers = map(int, df2['A'])print numbers #[11, 111, 1111]原创 2017-12-14 13:52:41 · 8795 阅读 · 0 评论 -
pandas 学习(一)
1、pandas 学习(一) —— read_csv ,read_excel对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型;data = pd.read_csv(file_name) # 数据文件路径,从文件读取数据返回 DataFrame 4. 基本成员函数df.dtypes:会按列给出各个列的数据类型;df.原创 2017-11-28 10:48:26 · 684 阅读 · 0 评论 -
xgboost.XGBClassifier, xgboost.train()
其中 xgboost.XGBClassifier()利用函数参数设置模型参数,xgboost.train()利用param列表设置模型参数。准确率:原创 2017-12-11 13:43:35 · 39664 阅读 · 8 评论 -
Python 第三方库的安装
第一步:下载第三方库本文以用于解析excel的xlrd为例,下载地址为:https://pypi.python.org/pypi/xlrd,下载版本为 xlrd-0.9.4.tar.gz第二步:解压下载到的安装包文件本文解压后的目录为D:\\xlrd-0.9.4第三步:配置环境变量:以windows 7为例,右键点击计算机,选择属性,在弹出的对话框中选择高级转载 2017-11-09 09:11:59 · 2714 阅读 · 0 评论