自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

转载 jieba 分词自定义词典问题

只对长词起作用对如果定义的词比jieba自己分的短,则没有用下面是三种分词方式的影响原始:[python] view plain copy#encoding=utf-8  import jieba  import os  import sys  test_text="电话号码查询"  #精确模式  se

2017-10-18 21:18:41 6222 1

转载 Tensorflow之快速加载MNIST数据集

from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfdef myprint(v): print(v) print(type(v)) try: print(v.shape) except: try:

2017-08-15 20:27:42 5286

转载 softmax函数简介

Softmax在机器学习中有非常广泛的应用,但是刚刚接触机器学习的人可能对Softmax的特点以及好处并不理解,其实你了解了以后就会发现,Softmax计算简单,效果显著,非常好用。我们先来直观看一下,Softmax究竟是什么意思我们知道max,假如说我有两个数,a和b,并且a>b,如果取max,那么就直接取a,没有第二种可能但有的时候我不想这样,因为这样会造成分值小的那个饥饿

2017-07-24 12:15:35 2630

转载 Django中的Hello World体验

要创建一个Django项目非常简单,使用startproject命令,输入项目名称:$ django-admin.py startproject mysiteDjango会在当前目录下自动生成一个名为mysite的文件夹,里面有以下文件:├── manage.py└── mysite    ├── __init__.py    ├── settings.py

2017-06-02 15:26:28 478

原创 ubuntu linux 如何换源?

linux ubuntu apt-get更换源方法:ubuntu 的默认源是美国的,所以下载起来特别慢,下面方法将源更换为国内源。用vi和gedit 打开 /etc/apt/sources.list 将其中的us.archive 全部替换为 cn.archive即可,这样,以后使用apt-get下载就会使用源自http://cn.archive.ubuntu.com 了。

2017-05-27 09:43:05 8789

转载 Python+Apache+CGI完全配置

Python+Apache+CGI完全配置时间 2016-01-31 19:20:04  51CTO推荐博文原文  http://xpleaf.blog.51cto.com/9315560/1740221主题 Python Apache HTTP Server Linux命令操作系统环境:Ubuntu 15.100.需求原因想在我的Linux

2017-05-24 09:48:37 420

转载 python中range和xrange的区别

range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。比如:1>>> range(5)2[0, 1, 2, 3, 4]3>>> range(1,5)

2017-03-29 10:02:27 5801

转载 数据仓库之星型结构和雪花型结构

在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型, 如图 2 。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定

2017-03-17 09:02:42 609

转载 文本分类的python实现-基于SVM算法

描述训练集为评论文本,标签为 pos,neu,neg三种分类,train.csv的第一列为文本content,第二列为label。可以单独使用SVC训练然后预测,也可以使用管道pipeline把训练和预测放在一块。SVC的惩罚参数C:默认值是1.0。C越大,对误分类的惩罚增大,趋向于对训练集全分对的情况,这样对训练集测试时准确率很高,但泛化能力弱。C值小,对误分类的惩罚减小,允许容错,泛化

2017-03-15 15:25:20 2836 1

转载 主题模型初学者指南[Python]

引言近年来涌现出越来越多的非结构化数据,我们很难直接利用传统的分析方法从这些数据中获得信息。但是新技术的出现使得我们可以从这些轻易地解析非结构化数据,并提取出重要信息。主题模型是处理非结构化数据的一种常用方法,从名字中就可以看出,该模型的主要功能就是从文本数据中提取潜在的主题信息。主题模型不同于其他的基于规则或字典的搜索方法,它是一种无监督学习的方法。主题可以由语料库中的共

2017-03-12 10:12:28 1887

转载 关系数据的组织

同专用的多维数据库相比,尽管用关系数据库表达多维的概念不大自然,但鉴于关系数据库仍是应用的主流,此方法仍是一种实用、可行的方案。为了能够使用关系表描述多维数据库中的多维信息,关系联机分析处理(Relational Online Analytical Processing,ROLAP)将多维结构进行分解,利用两种表(维表和事实表)来表达多维信息。1.维表与事实表的概念(1) 维表

2017-03-12 09:31:31 441

转载 SQL多表连接查询(详细实例)

本文主要列举两张和三张表来讲述多表连接查询。新建两张表:表1:student  截图如下:表2:course  截图如下:(此时这样建表只是为了演示连接SQL语句,当然实际开发中我们不会这样建表,实际开发中这两个表会有自己不同的主键。)一、外连接外连接可分为:左连接、右连接、完全外连接。1、左连接  left join 或 lef

2017-03-12 09:17:06 8664

转载 python数据分析师面试题选

以下题目均非原创,只是汇总python数据分析部分1. 如何利用SciKit包训练一个简单的线性回归模型利用linear_model.LinearRegression()函数 # Create linear regression objectregr = linear_model.LinearRegression()# Train the model using the

2017-02-15 21:48:05 1686 1

转载 奇异值分解(SVD)详解及其应用

1.前言第一次接触奇异值分解还是在本科期间,那个时候要用到点对点的刚体配准,这是查文献刚好找到了四元数理论用于配准方法(点对点配准可以利用四元数方法,如果点数不一致更建议应用ICP算法)。一直想找个时间把奇异值分解理清楚、弄明白,直到今天才系统地来进行总结。上一次学习过关于PCA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。特征值和奇异值在

2017-02-15 09:41:24 646

原创 Python在mysql中进行操作是十分容易和简洁的

首先声明一下,我用的是Windows系统!1、在Python中对mysql数据库进行操作首先要导入pymysql模块,默认情况下,Python中是没有安装这个模块的,可以在Windows的命令行中用pip install pymysql来安装(注意要连网)。除了pymysql模块外,还可以用其他模块。2、在Python中数据库表的创建就不细说了,我习惯是在navicat中创建。3、查找数据(1)不带

2017-01-06 10:10:07 11660

原创 解决Windows系统下python利用matplotlib绘图时中文乱码的问题

不讲道理,直接上解决方案第一步: 进入windows系统自带的字体文件夹中,自己电脑能支持的所有字体都在这里面。进入方法:控制面板-->外观和个性化-->字体,进入后的界面如下图所示:第二步: 在这个文件夹中找到“黑体 常规”这个字体的文件,如下图: 注:如果你的电脑中没有这个文件,你也可以试着找到其他的中文字体文件。第三步: 将刚才找到的文件复制到 “...\Lib

2016-12-26 16:48:53 702

转载 python 画图--简单开始及折线图

python 画图--简单开始及折线图1. 画最简单的直线图  代码如下:[python] view plain copy import numpy as np  import matplotlib.pyplot as plt    x=[0,1]  y=[0,1]  plt.figure()  plt.plot(

2016-12-22 16:45:22 4872

原创 非常简单而又非常完整的R语言主成分分析实例

本篇文章不讲有关主成分分析的理论知识,只讲实际操作。实例:(中学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测量其身高(X1)、体重(X2)、胸围(X3)和坐高(X4),数据如下。试对这30名中学生身体四项指标数据做主成分分析。 这些数据保存保存在students_data.csv中,该文件中的部分数据截图如下: 现在开始做主成分分析 第一步:将

2016-12-21 15:25:35 118026 22

原创 Python:Pandas:DataFrame基础(3)

接着上一篇文章,我们介绍使用iloc方法读取数据框的操作1、提取第四行数据print(data.iloc[3])输出结果如下:2、返回4-5行,1-2列数据print(data.iloc[3:5, 0:2]) #注意:区间仍然是左闭右开输出结果如下:3、也可以提取不连续行和列的数print(data.iloc[[1,2,4], [0,2]])输出结果如下:4、提取某几行的数据,保证所有列都在

2016-12-21 10:46:04 1061

原创 Python:Pandas:DataFrame基础(2)

我们接着上一篇的文章继续介绍 1、读取某一列的数据,假如我们要选择“维修毛利”这一列的数据进行操作print(data[u'维修毛利'])输出结果如下:2、使用数组的切片操作,但是注意了,切片得到的是行数据print(data[1:3]) #[1:3]是索引,并且区间是左闭右开输出结果如下:3、DataFrame的loc方法是帮助选择数据的,比如选择索引位置为0的一行数据print(da

2016-12-21 10:26:45 551

原创 Python:Pandas:DataFrame基础(1)

引子 在用python解决实际问题时,从磁盘文件读取数据是经常要做的工作。这篇文章主要说一下python读取excel文件中的数据。利用python读取excel中的数据是一件很容易的事情,读取的方式有很多,这里主要讲通过pandas中的read_excel()方法来读取的方式,在我看来这种方式已经足够简单了,以至于我不想再了解其他的方式。要想使用这种方式,首先需要在代码中引入两个包:`im

2016-12-21 09:44:16 3054

转载 Android 如何实现带滚动条的TextView,在更新文字时自动滚动到最后一行?

1、在布局文件中放置一个TextView,给它添加scrollbars和fadeScrollbars两个属性。如下设置:滚动条为垂直滚动条,并且一直可见(当TextView中的文字行数超过页面能显示的范围之后)。android:scrollbars="vertical" android:fadeScrollbars="false"2、在Activi

2016-12-15 15:46:03 3294

转载 android EditText多行文本输入的若干问题

以前习惯了网页以及swing上的文本框输入,现在到Android上突然没有了这种控件,刚开始使用起来还是比较费力的。为了想实现多行文本框的输入及显示效果,逐一解决了如下问题:1. 如何让EditText显示成为一个文本框的区域用来输入;2. 光标从首行开始显示;3. 如何是设置卷轴;4. 如何固定文本框的大小。5. 如何让文本框显示边线;为了达到如下

2016-12-14 16:21:45 4053

转载 python 多线程就这么简单

单线程   在好些年前的MS-DOS时代,操作系统处理问题都是单任务的,我想做听音乐和看电影两件事儿,那么一定要先排一下顺序。(好吧!我们不纠结在DOS时代是否有听音乐和看影的应用。^_^)from time import ctime,sleepdef music(): for i in range(2): print "I was

2016-12-06 13:42:12 218

转载 python 分词工具 jieba

全几天看到高手下了个jieba分词快速入门的东西  ,希望关注我博客的人也能看得到https://github.com/SalutLyndon/hello-world/blob/master/中文自然语言处理基本流# coding: utf-8# ###jieba特性介绍# 支持三种分词模式:# 精确模式,试图将句子最

2016-12-05 12:58:35 1428

转载 kd树搜索

统计学习笔记(3)——k近邻法与kd树        在使用k近邻法进行分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决的方式进行预测。由于k近邻模型的特征空间一般是n维实数向量,所以距离的计算通常采用的是欧式距离。关键的是k值的选取,如果k值太小就意味着整体模型变得复杂,容易发生过拟合,即如果邻近的实例点恰巧是噪声,预测就会出错,极端的情况是

2016-10-30 10:52:29 821

转载 Python中的闭包

什么是闭包?简单说,闭包就是根据不同的配置信息得到不同的结果再来看看专业的解释:闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。所以,有另一种说法认为闭包是由函数和与其相关的引用环境组合而成的实体。python实例看概念总是让人摸不着头脑,看几个pyt

2016-10-04 16:34:53 174

转载 http://www.dataguru.cn/article-1602-1.html

R语言最好的IDE——RStudio2012-7-2 22:30| 发布者: 仙豆| 查看: 26661| 评论: 8|原作者: rickey |来自: 沙湖王摘要: 看到很多的R语言教材,介绍的编辑器或者IDE都是很简陋的那些,就没有见到有人提到RStudio。对于不使用Emacs的人来说,RStudio真的是一个很好很好的IDE。 http://www.rstu

2016-09-06 21:59:20 661

转载 eclipse中添加python开发环境

eclipse中添加python开发环境由于自己一直使用的是eclipse这个IDE,在写spark,java等都是用它,主要是用它比较顺手,也并不是觉得它有什么特别好的之处。下面主要介绍一下,在window系统下,eclipse中搭建python的开发环境。1、首先安装python下载网站:https://www.python.org/downloads/并设置环境变

2016-08-26 10:10:12 902

转载 2分钟读懂Hadoop和Spark的异同

2分钟读懂Hadoop和Spark的异同  谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。解决问题的层面不一样首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个

2016-08-20 14:47:42 312

转载 AndroidAnnotations开发框架使用详解

AndroidAnnotations是一个能够让你快速进行Android开发的开源框架,它能让你专注于真正重要的地方。使代码更加精简,使项目更容易维护。相比原生的Android App代码量,几乎可以少一半,由于是开源项目,大家可以直接用,具体用法和介绍,大家可以参考下面的GitHub地址:https://github.com/excilys/androidannotations/wi

2016-08-09 11:19:15 676

转载 AndroidAnnotations(Code Diet)android快速开发框架

最近用了一款很不错的android快速开发框架,1000行的代码瞬间变成几百行,不用你会后悔的特点:(1) 依赖注入:包括view,extras,系统服务,资源等等(2) 简单的线程模型,通过annotation表示方法运行在ui线程还是后台线程(3) 事件绑定:通过annotation表示view的响应事件,不用在写内部类(4) REST客户端:定义客户端接口,自动生

2016-08-08 17:03:05 208

转载 EventBus使用详解(二)——EventBus使用进阶

前言:这段时间感觉自己也有点懒了,真是内心有点自责呢,除了工作,也没做点什么,EventBus也是一周前总结出来的,只能以写博客为名来弥补内心的罪恶感了,集合同事们做的项目,虽然上周开动了,但总感觉大家积极性不高,如何才能做一个合格的管理者,还真是一个考验。follow your heart!! just do it!相关文章:1、《EventBus使用详解(一

2016-08-07 22:17:59 258 4

转载 EventBus使用详解(一)——初步使用EventBus

前言:EventBus是上周项目中用到的,网上的文章大都一样,或者过时,有用的没几篇,经过琢磨,请教他人,也终于弄清楚点眉目,记录下来分享给大家。相关文章:1、《EventBus使用详解(一)——初步使用EventBus》2、《EventBus使用详解(二)——EventBus使用进阶》一、概述EventBus是一款针对Android

2016-08-07 22:14:40 202 5

转载 Android入门:广播发送者与广播接收者

一、广播发送者&广播接收者介绍1.广播接收者广播接收者简单地说就是接收广播意图的Java类,此Java类继承BroadcastReceiver类,重写:public void onReceive(Context context,Intent intent),其中intent可以获得传递的数据;广播意图就是通过Context.sendBroadcast

2016-08-04 09:00:49 271

转载 Android动画进阶—使用开源动画库nineoldandroids

转自http://blog.csdn.net/singwhatiwanna/article/details/17639987前言Android系统支持原生动画,这为应用开发者开发绚丽的界面提供了极大的方便,有时候动画是很必要的,当你想做一个滑动的特效的时候,如果苦思冥想都搞不定,那么你可以考虑下动画,说不定动画轻易就搞定了。下面再简单回顾下Android中的动画,本文后面会介绍

2016-08-03 15:03:55 309

转载 http://www.cnblogs.com/90zeng/

简易解说拉格朗日对偶(Lagrange duality)引言:尝试用最简单易懂的描述解释清楚机器学习中会用到的拉格朗日对偶性知识,非科班出身,如有数学专业博友,望多提意见!  1.原始问题假设是定义在上的连续可微函数(为什么要求连续可微呢,后面再说,这里不用多想),考虑约束最优化问题:称为约束最优化问题的原始问

2016-08-03 08:49:54 487

转载 http://blog.csdn.net/zouxy09

从最大似然到EM算法浅解[email protected]://blog.csdn.net/zouxy09        机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什

2016-08-02 13:30:55 2152

转载 http://blog.csdn.net/guolin_blog/article/details/9316683

高效加载大图片我们在编写Android程序的时候经常要用到许多图片,不同图片总是会有不同的形状、不同的大小,但在大多数情况下,这些图片都会大于我们程序所需要的大小。比如说系统图片库里展示的图片大都是用手机摄像头拍出来的,这些图片的分辨率会比我们手机屏幕的分辨率高得多。大家应该知道,我们编写的应用程序都是有一定内存限制的,程序占用了过高的内存就容易出现OOM(OutOfMemory)异常。我们可

2016-08-02 10:22:28 389

转载 http://blog.csdn.net/guolin_blog/article/details/17482165

在上一篇文章中,我们了解了Volley到底是什么,以及它的基本用法。本篇文章中我们即将学习关于Volley更加高级的用法,如何你还没有看过我的上一篇文章的话,建议先去阅读Android Volley完全解析(一),初识Volley的基本用法。在上篇文章中有提到过,Volley是将AsyncHttpClient和Universal-Image-Loader的优点集成于一身的一个框架。我们都知

2016-08-02 09:01:57 601

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除