自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (4)
  • 收藏
  • 关注

原创 numpy中的savez()同时保存数组、字符串、字典数据

python使用numpy中的savez()保存非数组数据到本地。报错:IndexError: only integers, slices (:), ellipsis (…), numpy.newaxis (None) and integer or boolean arrays are valid indices看下面的代码实例:import numpy as np# 简单的数组保存...

2018-10-31 19:56:40 6226 1

原创 详解python 3下文本文件的编解码

很多次遇到python 3下的文件编码,解码问题,我这里的平台是mac,下面吐血搞一波。。

2018-10-31 15:26:21 2542

原创 Python异常处理try...except的简单使用

1. try…except有时候我们写程序的时候,会出现一些错误或异常,导致程序终止。使用try…except,这样程序就不会因为异常而中断。把可能发生错误的语句放在try模块里,用except来处理异常。except可以处理一个专门的异常,也可以处理一组圆括号中的异常,如果except后没有指定异常,则默认处理所有的异常。每一个try,都必须至少有一个except。a=10b=0try:...

2018-10-30 11:19:20 20863 1

原创 Python中类方法定义及常用的实现方式

1. python类的属性和方法查看class Person_1: mind = '有思想' belif = '有信仰' animal = '高级动物' def tt(): passprint(Person_1.__dict__) #查询类Person中所有的内容,表现形式是字典.print(Person_1.__dict__['bel...

2018-10-29 19:02:18 21030 1

原创 关键词提取算法—TF/IDF算法

关键词提取算法一般可分为有监督学习和无监督学习两类。有监督的关键词提取方法可以通过分类的方式进行,通过构建一个较为完善的词表,然后判断每个文档与词表中的每个词的匹配程度,以类似打标签的方式,达到关键词提取的效果。优点是可以获得较高的精度,缺点是需要大批量的标注数据,并且要对词表进行人工维护。无监督学习既不需要词表也不需要标注语料,也因此无监督的学习得到了大量的应用。TF-IDF(term f...

2018-10-24 01:09:52 5004 1

原创 mac下anaconda安装selenium+PhantomJS

这里假设anaconda已经安装好了:(1)selenium的安装$ pip install seleniumselenium的安装很简单,也很快。Collecting selenium Downloading https://files.pythonhosted.org/packages/b0/c9/52390baa8d6b65c3e3b89f522c3a0fcf58f2b4faf...

2018-10-23 10:10:03 1668

原创 基于条件随机场的命名实体识别

我们知道HMM将分词作为字标注问题来解决,其中有两条独立性假设:一个是输出观察值之间严格独立,二是状态的转移过程中当前状态只与前一个状态有关(一阶马尔可夫型)。...

2018-10-20 22:30:50 2287

原创 CRF++使用简介(windows下非接口)

CRF简介CRF++是著名的条件随机场的开源工具,也是目前综合性能最佳的CRF工具。CRF 的工具有两种,一种是支持Linux环境的,一种是支持Windows环境的,大家可以自行根据自己的系统进行下载。(在此我下载的是CRF++ -0.58)linu的安装应该简单些,几行命令就能搞定,而windows下其实严格来讲不能说是安装。我们解压我们下载的压缩包文件到某一个目录下面即可。CRF同...

2018-10-16 18:23:53 5276 6

原创 循环神经网络应用案例

基础介绍可以参考:https://blog.csdn.net/lilong117194/article/details/82958326https://blog.csdn.net/lilong117194/article/details/81978203tensorflow的编程堆栈示意图:强烈建议使用以下API编写TensorFlow程序:评估器Estimators,代表一个完整的...

2018-10-15 22:46:33 3388 1

原创 循环神经网络基础介绍

在应用循环神经网络的过程中,还是会有些地方疑惑,所以还是要回归下问题的本质。学而不思则惘,思而不学则怠。。1. 循环神经网路简介首先循环神经网络的主要用途是处理和预测序列数据。在之前的全链接神经网络或卷积神经网络模型中,网络的结构都是从输入层到隐藏层再到输出层,层与层之间是全链接或者部分连接的,但每层之间的节点是无法连接的。而循环神经网络的隐藏层之间的节点是有连接的,隐藏层的输入不仅包括输入层...

2018-10-08 14:19:44 3431 3

原创 LSTM时间序列预测及网络层搭建

最近看到一篇博客,是时间预测问题,数据和代码的原地址在这里,https://www.jianshu.com/p/5d6d5aac4dbd下面只是对其复现和思考:首先关于数据预处理的问题,大家可以参考:https://blog.csdn.net/lilong117194/article/details/82911073这里的问题是:给你一个数据集,只有一列数据,这是一个关于时间序列的数据,从...

2018-10-07 10:48:38 16584 10

原创 sklearn 中的preprocessing数据预处理

sklearn preprocessingStandardization即标准化,尽量将数据转化为均值为零,方差为一的数据,形如标准正态分布(高斯分布)。实际中我们会忽略数据的分布情况,仅仅是通过改变均值来集中数据,然后将非连续特征除以他们的标准差。一、标准化,均值去除和按方差比例缩放数据集的标准化:当个体特征太过或明显不遵从高斯正态分布时,标准化表现的效果较差。实际操作中,经常忽略特征数据...

2018-10-06 19:44:45 5259

The Matrix Cookbook

矩阵求导数、求逆、矩阵分解、多元统计、多种矩阵运算的公式的工具书,在公式推倒中可以时常查阅的资料,机器学习必备工具!

2017-09-24

feedparser-5.2.1

基于python的第三方包,python中最常用的RSS程序库

2017-08-17

机器学习实战(源码及数据)

机器学习实战(源码和数据样本),machine learning in action

2017-08-04

机器学习实战之KNN

约会网站数据集,手写体数据集

2017-08-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除