TH_NUM的博客

日常积累

python numpy中nonzero()的用法

当使用布尔数组直接作为下标对象或者元组下标对象中有布尔数组时,都相当于用nonzero()将布尔数组转换成一组整数数组,然后使用整数数组进行下标运算。 nonzeros(a)返回数组a中值不为零的元素的下标,它的返回值是一个长度为a.ndim(数组a的轴数)的元组,元组的每个元素都是一个整数数组...

2018-05-19 15:47:41

阅读数:5

评论数:0

python 的map与zip 函数

一、map函数 首先Python中的map函数是很简单的。意为将第二个参数(一般是数组)中的每一个项,处理为第一个参数的类型。比如如下的代码,将a这个list的每一项都从int类型转化为str类型。 #-*-coding:utf-8-*- a=[1,2,3]; print map(st...

2018-05-19 15:20:14

阅读数:2

评论数:0

linux screen

screen简介: 介绍:Screen是一个可以在多个进程之间多路复用一个物理终端的窗口管理器,每一个screen 称为一个session ,在每一个session上面可以创建多个窗口。 而且每一个session 可以离开,但不会终止session所运行的程序。 会话命令 1.创建一个...

2018-05-18 10:13:57

阅读数:60

评论数:0

numpy的getA()/getA1()/getH()/getI()函数

1.mat.getA() 将自身矩阵变量转化为ndarray类型的变量。 等价于np.asarray(self) 原因: mat 不可以直接通过index访问元素,例如下面的mat[3][6]就会报错。 a = np.mat([[1,2],[3,4]]) a Out[251]: ...

2018-05-17 13:04:58

阅读数:10

评论数:0

set集合的合并

操作符|用于求两个集合的并集,这也是一个按位或(OR)操作符(参见附录C)。在数学符号表示上,按位或操作与集合求并操作使用相同记号。 a=set([1,2,4]) b=set([4,5,6]) print a|b 输出: set([1, 2, 4, 5, 6])...

2018-05-16 16:53:43

阅读数:7

评论数:0

python 创建一维的0向量

第一种方法: A=[0]*8 第二种方法: import numpy as np A=np.zeros(8)

2018-05-16 16:49:51

阅读数:5

评论数:0

python pickle序列化存储

序列化存储: 序列化对象可以在磁盘上保存对象,并在需要的时候读取出来。任何对象都可以执行序列化操作,字典对象也不例外。 def storeTree(inputTree,filename): import pickle fw=open(filename,"w&a...

2018-05-16 15:40:47

阅读数:3

评论数:0

python matplotlib 画注解图

import matplotlib.pyplot as plt #使用文本注解绘制树节点 #定义文本框和箭头格式 decisionNode=dict(boxstyle="sawtooth",fc="0.8") leafNod...

2018-05-16 14:56:55

阅读数:6

评论数:0

python 引用传值、赋值

python 数组 A=B 默认的是引用传值,改变A中的元素,B中的元素同样改变。 而A=B[:]则是传值,改变A中的元素的值,B中元素的值保持不变。 样例: 引用 a=[1,2,3,4] b=a[:] b[0]=4 print(b) print(a) def Cal(A): ...

2018-05-16 14:26:17

阅读数:2

评论数:0

python append和entend的区别

了Python语言列表类型自带的extend()和append()方法。这两个方法功能类似,但是在处理 多个列表时,这两个方法的处理结果是完全不同的。 假定存在两个列表,A和B: A=[1,2,3] B=[4,5,6] A.append(B) 输出: [1, 2, 3, [4, 5,...

2018-05-16 14:15:49

阅读数:1

评论数:0

python 列举文件夹下面的文件

#列举文件 from os import listdir trainningFileList=listdir('digits/testDigits') print(trainningFileList)

2018-05-16 10:44:42

阅读数:3

评论数:0

matplotlib 制作原始数据的散点图

import numpy as np import matplotlib.pyplot as plt returnMat=np.array([[1,2],[3,4]]) fig=plt.figure() ax=fig.add_subplot(111) ax.scatter(returnMat[:,...

2018-05-15 21:54:26

阅读数:12

评论数:0

numpy 对字典进行排列

import operator import numpy as np dia={'A':2,'B':1} #对字典值进行排序 sortDia=np.sorted(dia.iteritems(),key=operator.itemgetter(1),reverse=True) print(sortD...

2018-05-15 21:31:16

阅读数:6

评论数:0

python numpy 数组如何对每个元素进行操作

python filter 如何应用在numpy array中,比如我有一个二维numpy数组,想将数组中小于0的置零大于零的保留原值,但是不想用for循环。 import numpy as np a=np.random.randint(-5,5,(4,4)) print(a) #第一种...

2018-05-15 19:21:25

阅读数:9

评论数:0

numpy 花式索引,ix_

#coding:utf-8 import numpy as np b=np.arange(12).reshape(3,4) print(b.flat) for i in b.flat: print(i) f=b.flat b.flat=7 print(b) a=[1,2,3] b=[...

2018-05-15 12:57:32

阅读数:6

评论数:0

numpy 数组叠加

#coding:utf-8 import numpy as np ## 数组的堆叠 a=[[1,2,3],[4,5,6],[7,8,9]] b=[['e',2,5],[10,11,12],[14,15,16]] print("a:",a) #注意水平堆叠...

2018-05-15 12:23:14

阅读数:20

评论数:0

numpy 矩阵形状调整:拉伸、变成一位数组

#coding:utf-8 import numpy as np ## 改变数组的形状 #将b 变成3*4 的矩阵 b=np.arange(24).reshape(3,8) print(b) #将多维数组变成 1维数组 a=b.ravel() print(a) #将多维数组变成 1维数组,f...

2018-05-15 12:03:53

阅读数:15

评论数:0

numpy 一维数组的切片与索引

#coding:utf-8 import numpy as np a=np.array([[1,2],[3,4],[5,6],[7,8],[9,10]]) #直接取1-3索引的值 print(a[1:3]) #每隔2 个取一个元素 print(a[:5:2]) #将数组倒叙 print(a[...

2018-05-15 11:45:40

阅读数:2

评论数:0

Hyperopt TypeError: 'generator' object is not subscriptable

原因与解决方案 原因与解决底层库networkx更新造成的,Hyperopt不支持networkx-2.0,我换成了1.11版本就OK了. pip install networkx==1.11

2018-05-13 23:43:56

阅读数:14

评论数:0

Pandas 获取列名

获取DataFrame的列名是一个比较简单的操作,又以下几个方法: 1.[column for column in df] 2.df.columns.values 返回 array 3.list(df) 4.df.columns 返回Index,可以通过 tolist(), 或者 list...

2018-05-13 00:10:45

阅读数:61

评论数:0

12306火车票抢票Python代码

语言版本:Python 1、自动登录12306并保持Cookie 2、自动实现抢购设置的某日期的某车次的票 3、攻克排队系统陷阱,避免进入排队系统 4、循环监控某车次的票,直到有票,自动抢购 5、抢票时若出现异常,自动重新抢票,直到成功 ''' @初始配置项 Author:韦玮 -...

2018-05-10 23:37:27

阅读数:14

评论数:0

如何判断Linux是32位还是64位?

在linux终端输入 getconf LONG_BIT 命令 getconf LONG_BIT 如果是32位机器,则结果为32 如果是64位机器,则结果为64

2018-05-09 13:47:27

阅读数:9

评论数:0

Python struct模块的pack、unpack示例

import struct pack、unpack、pack_into、unpack_from import struct #pack - unpack print print '===== pack - unpack =====' str = struct.pack(...

2018-05-07 12:41:35

阅读数:7

评论数:0

大小端

大小端 转载出处(http://blog.csdn.net/lis_12/article/details/52698634) 端: 数据在存储器中存放顺序的顺序。 分度值,byte,即byte都是按照正常顺序,但是byte组装成的int时byte的顺序则不同。 大端 较低的有效字节存放在...

2018-05-07 12:26:20

阅读数:12

评论数:0

python中的ord函数

chr()、unichr()和ord() chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。unichr()跟它一样,只不过返回的是Unicode字符,这个从Python 2.0才加入的unichr()的参数范围依赖于你的Python是如何被编译...

2018-05-07 12:21:15

阅读数:21

评论数:0

Linux 系统下查看硬件信息命令大全

lscpu lscpu命令能够查看 CPU 和处理单元的信息。该命令没有任何其他选项或者别的功能。 lscpu 运行该命令会看到下面输出: lspci lspci是另一个命令行工具,可以用来列出所有的 PCI 总线,还有与 PCI 总线相连的设备的详细信息,比如 VGA 适配器、显卡...

2018-04-25 13:27:32

阅读数:25

评论数:0

windows Anaconda lightgbm 安装

更新:2018年4月25日测试,win和linux平台都可以通过pip install lightgbm安装最新的lightgbm了,现在版本是lightgbm-2.0.3。 下载whl https://pypi.python.org/pypi/lightgbm/2.0.3 安装 拷贝...

2018-04-25 13:10:54

阅读数:55

评论数:0

Linux下安装anaconda

1.下载(直接到清华镜像下载) 下载链接:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/,选择合适的版本。 2.安装anaconda bash Anaconda3-4.3.1-Linux-x86.sh 安装完成之后要重启终...

2018-04-25 13:08:11

阅读数:31

评论数:0

KMeans与深度学习自编码AutoEncoder结合提高聚类效果

特征是用户的消费商品的消费金额,原始数据(部分)是这样的: id,goods_name,goods_amount 1,男士手袋,1882.0 2,淑女装,2491.0 3,淑女装,2492.0 2,女士手袋,345.0 4,基础内衣,328.0 5,商务正装,4985.0 5,时尚,969....

2018-04-25 01:14:54

阅读数:40

评论数:0

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

python读取文件时提示”UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 205: illegal multibyte sequence” 解决办法1. FILE_OBJECT= open(‘order.l...

2018-04-25 01:10:17

阅读数:24

评论数:0

pandas.DataFrame

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source] Two-dimensional size-mutable, potentially heterogeneous tabula...

2018-04-23 22:09:35

阅读数:12

评论数:0

稀疏矩阵之python sparse实现

工程实践中,多数情况下,大矩阵一般都为稀疏矩阵,所以如何处理稀疏矩阵在实际中就非常重要。本文以python里中的实现为例,首先来探讨一下稀疏矩阵是如何存储表示的。 1.sparse模块初探 python中scipy模块中,有一个模块叫sparse模块,就是专门为了解决稀疏矩阵而生。本文的大部分...

2018-04-22 23:06:19

阅读数:14

评论数:0

scipy.sparse.hstack vstack

首先格式是符合 coo_matrix 才能使用sparse进行拼接。 hstack : 将矩阵按照列进行拼接 from scipy.sparse import coo_matrix, hstack,vstack A = coo_matrix([[1, 2], [3, 4]]) print(A...

2018-04-22 22:37:51

阅读数:414

评论数:0

基于sklearn 的one hot encoding

1.one hot编码的由来 在实际的应用场景中,有非常多的特征不是连续的数值变量,而是某一些离散的类别。比如在广告系统中,用户的性别,用户的地址,用户的兴趣爱好等等一系列特征,都是一些分类值。这些特征一般都无法直接应用在需要进行数值型计算的算法里,比如CTR预估中最常用的LR。那针对这种情况最...

2018-04-22 21:11:23

阅读数:24

评论数:0

vim清空文件所有内容

在使用vim编辑器的时候,有时候编辑一个文件,而文件内容比较多,如果需要快速清空整个文件,可以使用一下命令: 在命令模式下,首先执行 gg 这里是跳至文件首行 再执行:dG 这样就清空了整个文件! 还有一种方法就要退出VIM,然后使用echo >>...

2018-04-21 10:57:43

阅读数:22

评论数:0

通过Pandas读取大文件

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取: import pandas as pd f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv') reader = pd.read_csv(f, sep=',', iterator=T...

2018-04-19 18:05:01

阅读数:24

评论数:0

pandas对列数据进行处理,将Nan变为0,将str变为0

test.csv文件内容: 1,2, 1,54 89,5 6,7,9 代码: import pandas as pd import numpy as np import re def format(x): value = re.compile(r'^\s*[-+]*[0-9]...

2018-04-19 17:54:28

阅读数:165

评论数:0

TensorFlow保存和加载训练模型

对于机器学习,尤其是深度学习DL的算法,模型训练可能很耗时,几个小时或者几天,所以如果是测试模块出了问题,每次都要重新运行就显得很浪费时间,所以如果训练部分没有问题,那么可以直接将训练的模型保存起来,然后下次运行直接加载模型,然后进行测试很方便。 在tensorflow中保存(save)和加载(...

2018-04-18 00:04:46

阅读数:35

评论数:0

python数据分析之numpy初始化

以下都用numpy的标准“import numpy as np” 1.numpy是同构数据多维容器,同构即数据类型相同 2.初始化: 2.1 np.arange([start,] end [, step])#与list的range相似 >&...

2018-04-18 00:02:49

阅读数:7

评论数:0

numpy做矩阵运算

矩阵运算 论numpy中matrix 和 array的区别: http://blog.csdn.net/vincentlipan/article/details/20717163 matrix 和 array的差别: Numpy matrices必须是2维的,但是 numpy array...

2018-04-17 23:57:56

阅读数:10

评论数:0

feed_dict tf 报错提示ValueError: setting an array element with a sequence.

print (sess.run(output,feed_dict={input1:[[1.0,2.0,3.0]],input2:[[2.0],[3.0],[4.0]]}))就能运行. 错误原因: feed_dict格式本身不能用tf.constant赋值的或者tf.get_variable赋值。

2018-04-17 18:18:29

阅读数:20

评论数:0

机器学习心得

神经网络为什么具有对非线性关系进行建模的能力? 1.每个神经元会先应用一个非线性激活函数。正是由于这个激活函数,神经网络具有对非线性关系进行建模的能力 持续更新中….. ...

2018-04-17 01:26:19

阅读数:14

评论数:0

python 实现 机器学习(周志华) 参考答案 第五章 神经网络 5.7 RBF 神经网络

#-*- coding:utf-8 -*- import re import xlrd import xdrlib,sys import xlwt import datetime import time import numpy as np def rand(a, b): #返回a 行 n 列 ...

2018-04-16 00:19:36

阅读数:68

评论数:0

HADOOP基本操作命令

HADOOP基本操作命令 在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。 假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。 启动与关闭 启动HADOOP 1. 进入HADOOP_HOME目录。 2. ...

2018-04-14 12:20:27

阅读数:18

评论数:0

Java去除字符串中的空格

特别注意了 Strim或者Trip都是只能去除头部和尾部的空字符串。中间的部分是不能够去除的! 推荐使用ApacheCommonse的StringUtils.deleteWhitespace(“a b c”); 删除所有空格。 如果我自己写,我会采用foreache遍历每一个字符串中的字符然...

2018-04-14 12:12:44

阅读数:10

评论数:0

BufferedImage与byte[]互转

一、需要用到的类 java.awt.image.BufferedImage; javax.imageio.ImageIO; java.io.*; 二、为什么要将BufferedImage转为byte数组 在传输中,图片是不能直接传的,因此需要把图片变为字节数组,然后传输比较方便;只需要一...

2018-04-14 12:10:07

阅读数:18

评论数:0

java中判断文件是否是图片文件

使用Image读取文件时,如果是非图像文件,则会返回null。 参考代码: try { Image=ImageIO.read(new File(name)); if (image == null) { valid = false; ...

2018-04-14 12:08:11

阅读数:22

评论数:0

在HttpClient请求的时候,返回结果解析时出现java.io.IOException: Attempted read from closed stream. 异常,解决

原因是EntityUtils.toString(HttpEntity)(或者EntityUtils.toByteArray())方法被使用了多次。所以每个方法内只能使用一次。

2018-04-14 12:07:13

阅读数:12

评论数:0

HttpClient获取响应状态Status

HttpClient获取响应状态Status 我们HttpClient向服务器请求时, 正常情况 执行成功 返回200状态码, 不一定每次都会请求成功, 比如这个请求地址不存在 返回404 服务器内部报错 返回500 有些服务器有防采集,假如你频繁的采集数据,则返回403 拒绝你请求。...

2018-04-14 12:06:22

阅读数:23

评论数:0

Java发送Http请求并获取状态码

通过Java发送url请求,查看该url是否有效,这时我们可以通过获取状态码来判断。 try { URL u = new URL("http://10.1.2.8:8080/fqz/page/qizha/pros_add.jsp"); tr...

2018-04-14 12:04:38

阅读数:17

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭