自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

中志融一的博客

厚积薄发

  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 TfidfVectorizer in scikit-learn : ValueError: np.nan is an invalid document

我使用scikit-learn中的TfidfVectorizer学习从文本数据中提取一些特征。我有一个带标志的CSV文件(可以是+1或-1)和一个评论(文本)。我将这些数据导入DataFrame,以便运行Vectorizer。 代码如下:import pandas as pdimport numpy as npfrom sklearn.feature_extraction.text ...

2018-07-07 19:05:58 8891 5

原创 LeetCode:008 String to Integer (atoi)

本题的题型内容如下: 本题的解决思路主要注意一下几点: 1,当输入为空时的处理; 2,前面的空白字符的处理 3,如何得到前面的正负号 4,注意最大值和最小值,防止溢出 算法实现 javaclass Solution { public int myAtoi(String str) { int index = 0; int total = ...

2018-06-21 20:36:52 265

原创 005-Longest Palindromic Substring (最长回文子串)

最大回文子串出自《Leetcode》第6题,原题如下: Given a string S, find the longest palindromic substring in S. You may assume that the maximum length of S is 1000, and there exists one unique longest palindromic subs...

2018-06-20 19:10:51 269

原创 基于朴素贝叶斯的新闻分类

贝叶斯理论 在我们有一大堆样本(包含特征和类别)的时候,我们非常容易通过统计得到 p(特征|类别) .大家又都很熟悉下述公式: #coding: utf-8import osimport timeimport randomimport jieba #处理中文#import nltk #处理英文import sklearnfrom sklearn.naive_ba...

2018-03-09 21:44:10 992

原创 算法面试题3:小猫钓鱼

问题描述: 小哼和小哈在玩一个扑克游戏——小猫钓鱼。游戏规则:将一副扑克牌平均分成两份,每人拿一分。小哼先拿出手中第一张扑克牌放在桌上,然后小哈也拿出手中第一张扑克牌,并放在小哼刚才打出的扑克牌的上面,两人交替出牌。出牌时,如果某人打出的牌与桌上某张牌的牌面相同,可将两张相同的牌及其中间所夹的牌全部拿走,并依次放到自己手中牌的末尾。当任意一人手中当牌出完时,游戏结束,对方获胜。算...

2018-02-23 08:37:36 2143

原创 算法面试题2:快速排序算法

快速排序是极为优秀的排序算法,下面对该算法进行详细的计算。 算法基本思路: 快速排序一般基于递归实现。其思路是这样的: 1.选定一个合适的值(理想情况中值最好,但实现中一般使用数组第一个值),称为“枢轴”(pivot)。 2.基于“枢轴”(pivot)值,将数组分为两部分,较小的分在左边,较大的分在右边。 3.可以肯定,如此一轮下来,这个枢轴的位置一定在最终位置上。 4.对两个子数组分...

2018-02-19 10:51:53 1497

原创 算法面试题1:约瑟夫问题(c++实现方式)

描述:约瑟夫问题:有n只猴子,按顺时针方向围成一圈选大王(编号从1到n),从第1号开始报数,一直数到m,数到m的猴子退出圈外,剩下的猴子再接着从1 开始报数。就这样,直到圈内只剩下一只猴子时,这个猴子就是猴王,编程求输入n,m后,输出最后猴王的编号。输入:每行是用空格分开的两个整数,第一个是 n, 第二个是 m ( 0 < m, n < 300)。最后一行是: 0 0输出:对于...

2018-02-19 07:53:52 724

原创 Python enumerate用法总结

最近和实验室在做滴滴智能信号灯的比赛,做了近一个月能排到前十,今天主要说说enumerate的使用。 1、enumerate() 说明 enumerate()是python的内置函数 enumerate在字典上是枚举、列举的意思 对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值 enumerate多用于

2017-12-28 11:48:08 509

原创 基于朴素贝叶斯的文本分类

最近在学习自然语言处理,做了一个文本分类的demo,主要是基于朴素贝叶斯算法和TF-IDF方法的文本分类挖掘,下面的代码如下:# -*- coding:utf-8 -*-import numpy as npdef loadDataSet(): postingList=[['my','dog','has','flea','problems','help','please'],

2017-11-22 15:15:10 844

原创 K近邻算法(全解)

最近实验室成立了一个兴趣小组,每周给师弟师妹们。讲解一些算法,把讲解过程的PPT放在上面,供大家学习参考。 0、问题的提出 我们在实际生活中经常有一句话:“物以类聚,人以群分”我们总是以相近的事物去评价一个人,同时我们生活中经常有一句话叫做:“你的朋友决定了你的价值”,今天讲解的这个算法就是一这个理念来设计的一个算法,这个算法虽然简单,但是却在我们的生活中用处非常的大。

2017-11-13 21:58:27 775

原创 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte

python数据编码格式的问题一直是困扰我们,我在Mac电脑的执行程序f1=open("fenci_result.txt",'r')报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte经过我多次实验,并查找各种学习资料,发现这段代码可以解决,通过以

2017-11-09 13:47:42 7627 2

原创 Python:类的继承

最近师弟在学习python语言,对于类,继承等基本概念不是很了解,所以写这篇文章来详细的讲解一下继承的概念和在python中的使用。a 单继承定义一个时间类,带默认参数class mytime(object): def __init__(self,hour=21, \ minute=13, \ second=50):

2017-10-11 10:09:31 1437

原创 python核心编程:windows环境下,利用CGIHTTPServer简单网页搭建

最近师弟在学习python,上面有个网页的搭建的小作业,下面在这篇博客详细讲解一下如何利用CGIHTTPServer简单网页搭建。(博客里面的图为网络摘取,代码步骤真实可靠) 环境:windows 语言:python2.7 首先创建一个文件夹www,在该目录下创建cgi-bin文件夹(我试过,可以不创建,直接在该文件夹下创建脚本文件也可,其中www文件为服务器的根目录,里面的文件为服务器目录)

2017-10-09 10:35:01 868

原创 语义识别(一):隐性马尔可夫模型

隐性马尔可夫模型在语义识别领域有着广泛的应用,下面我整合了网络上和书上的有关资料,通俗详细的论述了隐性马尔可夫模型和Viterbi算法。隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。隐性马尔可夫模型在语义识别,分词模型中也有广泛的应

2017-10-06 11:27:19 9596 2

原创 Python:with语句的使用

with语句作为python的重要语法形式,是在Python2.5中引入的一种与异常处理相关的功能,2.6版本开始缺省使用。在资源管理,线程中锁的自动获取和释放等with语句都有重要的应用。一、基础知识要使用 with 语句,首先要明白上下文管理器这一概念。有了上下文管理器,with 语句才能工作。下面是一组与上下文管理器和with 语句有关的概念。 上下文管理协议(Context Managem

2017-10-03 19:02:01 403

原创 Tensorflow应用实例(一)

引言:tensorflow作为现在最热的深度学习框架,如何利用tensorflow实现你所要实现的机器学习和深度学习算法成为了大家学习的重点,下面给出了利用tensorflow实现有监督学习的一般框架。 一、有监督学习的一般框架: 如下图所示: 二、一般步骤 1、对模型参数初始化; 2、读取训练参数(一般将参数的顺序打乱); 3、计算损失(损失刻画的最后一步得到的输出与来自训练集期望

2017-09-26 21:45:07 4775

原创 基本算法:python递归算法

有时候写代码就是“老中医给别人看病“,经验很重要! 最近在做语义识别的项目,为了对语义识别的算法有一个深入的了解,所以抽出部分精力研究一下递归算法,递归作为最简单的基本算法,不是很难,原理大家都理解,下面我就结合我的理解,讲解一下递归算法: (一)递归的定义: 递归就是子程序(或函数)直接调用自己或通过一系列调用语句间接调用自己,是一种描述问题和解决问题的基本方法。递归常用来解决结构相似的问题

2017-09-24 16:44:33 6994

原创 windows10: windows python+opencv环境搭建(最新)

最近实验室由于项目需要搭建opencv的开发环境,在安装过程中查询了部分资料,发现有些资料不是太老就是有很多错误,所以把整个安装过程整理出档案,便于大家学习。(环境为python2.7+win10+64位系统) 1、python库的安装 在python官网下载最新的python-2.7.14 amd64.msi,安装过程中会遇到下面的步骤: 在这一步就可以设置环境变量,很多新手安装没有经验

2017-09-19 18:28:08 10126 8

原创 机器学习实战(一):Apriori算法实现关联分析

最近开始做语义识别,所以不得不开始钻研机器学习算法,最近主要看的是《机器学习实战》这本书,所以里面很多的内容都是出自《机器学习实战》那本书,同时加入了自己的理解。 Apriori算法简介: Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。 Apriori(先验的,推测的)算法应用广泛,可用于消费市场价格分析,猜测顾客的消费习

2017-09-14 20:30:00 1043

原创 Keras模块简述

17年8月份第3篇日志; 最近忙里偷闲开始进行一些数据挖掘的探索,不过我还有两年的充电时间,如何高效的利用这两年的时间,提高自己的技能,可以说成为了我实践的中重点。 Keras主要包括14个模块,本文主要对Models、layersInitializations、Activations、Objectives、Optimizers、Preprocessing、metrics共计8个模块分别展开介绍

2017-08-08 09:28:24 656

原创 Python2.7: CGIHTTPServer使用案例及官方文档翻译

8月份第2篇文章 下面是CGIHTTPserver的官方文档翻译并附带应用案例: CGIHTTPServer模块定义了一个请求处理程序类,与BaseHTTPServer.BaseHTTPRequestHandler兼容的接口,并从SimpleHTTPServer.SimpleHTTPRequestHandler继承行为,但也可以运行CGI脚本。 记:此模块可以在Unix和Windows系统上运

2017-08-01 18:14:05 1348

原创 Android:定时器Timer的停止和重启实现

17年8月第1篇日志 7月份做了一个项目,利用自定义控件呈现一幅动画,当时使用定时器来控制时间,但是当停止开启时总是出现问题。一直在寻找合理的方法解决这个问题,一直没有找到,最近终于找到了合理的方法来解决这个问题。 大家如何查询有关资料,一定知道timer,timertask取消的方式是采用Timer.cancel()和mTimerTask.cancel(),可是大家发现这种发式取消后,再次开始

2017-07-31 20:56:57 31047 6

原创 WEB服务器:利用python CGI实现简单的微信后台服务器

17年7月第4篇博客,最近在做微信公众号后台的开发,因为项目的原因,实验了很多的方法。下面就讲解其中的一种方法,这种方法在网上的博客上还没有看到过,使用的环境是windows Server2012 ,IIS管理器,使用上面讲过的CGI脚本模块在IIS上实现CGI 下面开始简单讲解我的脚本模块,主要实现的是微信后台服务器token的验证。实现后台的微信服务器的验证,其实其原理非常简单,微信腾讯官方服

2017-07-23 11:11:57 1819

原创 WEB:python CGI 交互式界面实现

7月第3周博客, 最近在做一个项目,里面用到了网站的开发,而CGI作为网页开发的基础,要有有一个深入的理解。读了一些好的例子,特别拿出来与大家分享。不过技术的学习也确实是一个循序渐进的过程,很多事情急不得,要慢慢来,大家一起努力。 下面贴出网页交互的全部代码,最后再给大家足部的见解:#!/usr/bin/env pythonfrom cgi import FieldStoragefrom os

2017-07-18 21:59:37 3262 1

原创 WEB服务器:在IIS上实现python CGI

2017年7月份第2篇博客 今天参加了一个投资洽谈会,学习到的东西颇多。这个世界真的不缺少投资和想法的一个时代。行啦,不瞎吹牛逼了,还是开始我的技术博客吧!今天讲解的问题是如何在IIS上实现 python CGI环境,我用的开发环境时腾讯公司的腾讯云服务器,操作系统为Windows Server 2012,python3.6环境。 a、首先在服务器上找到相应的IIS目录,找到服务器管理器 b、

2017-07-09 21:07:43 775

原创 Python:urllib2使用总结

17年7月第1篇博客。 最近在做微信公众号开发,涉及到服务器与腾讯服务器进行图片等素材向下拉去的过程。其中用到了urllib函数库的使用。下面详细的对该函数库进行一系列的介绍,和一些简单的使用规则。 一.urllib2简介 urllib2提供一个基础函数url open,通过向指定的URL发出请求来获取数据。最简单的形式就是:import urllib2response=urllib2.ur

2017-07-04 10:12:37 377

原创 android:蓝牙4.0的搜索、连接及数据传输(真实可用)——(一)

每周写一篇博客,愿共同促进。17年6月第4周 最近两周由于时间问题,博客一直没有更新。这周做了两个项目,一个是用自定义控件画了一个动画,另一个就是利用蓝牙4.0进行的一个智能设备的一个通信。对于蓝牙4.0,在做项目的过程中发现,一方面是网上的资料大多还是13年左右的资料,而且很多在现在的现在的编译环境下,很多不能实现。另一点就是很多资料几乎都是简单的重复,而且很多错误简单重复,并没有经过大家的实际

2017-06-25 16:05:28 5844 2

原创 android应用案例:Tablayout 的使用(仿微信底栏)

2017年6月第一篇博文。 最近做项目越来越发对于程序语言的深入理解的重要性,否则很难有较大的成长。今天主要写关于如何利用Tablayout写微信底部栏的过程。Tab在中国的的很多应用App上都有应用,比如微信,QQ,网易新闻等。基于此,写下这篇博客。首先大家看一下做的效果: 首先我们先来分析一下代码结构,简单的微信底部栏主要的代码结构如下图所示: 细节入手 我们以微信为例,大家可以从图

2017-06-03 22:04:29 1721 1

原创 Android:Socket UDP通信

UDP 是User Datagram Protocol的简称,一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。1、UDP是一个无连接协议,传输数据之前源端和终端不建立连接;2、不维护连接状态,包括收发状态等,因此一台服务机可同时向多个客户机传输相同的消息;3、UDP信息包的标题很短,8个字节,对于TCP的20个字节信息包的额外开销很小;4、吞吐量不受拥挤控制算法的调节,只受应用软件生成

2017-05-27 22:18:28 455

原创 Python:Template使用指南

17年7月第5篇日志 七月快要结束,八月马上就要开始。最近人工智能的势头越来越过,不过这个浪潮下谁留下来,谁能踏实作出新的成就,一切都未可知。 本周带来的博客主要讲解Template的使用,这篇博客是基于python3写的,因为最近在做微信的项目采用的语言就是python 3,下面进入正题。 Template无疑是一个好东西,可以将字符串的格式固定下来,Template

2017-05-17 21:41:29 19411

原创 Android:百度地图,点聚合功能

每周坚持写博客,愿意共同促进。 最近由于工作需要使用到百度地图上的点聚合功能,查找网上的资料写的不是很详细,走过了不少坑,今天特别把完整的过程写下来。 实现百度地图的点聚合功能,第一步要下载百度地图的SDK,并进行安装,这里就过多介绍了。下面开始介绍如何实现百度地图的点聚合功能,要在百度地图的下载里面下载百度地图的Demo,在下载里面找到BaiduMap_AndroidSDK_v

2017-05-10 13:48:40 3669 1

原创 基于tensorflow的MNIST数字识别

基于tensorflow的MNIST数字识别 坚持每周更新一篇博客,为了督促自己,当然主要是围绕两个领域,一个是所谓的人工智能领域,另一个则是围绕着android的开发,别的不说,直接进入正题,基于tensorflow的书写识别。 别的不说,先把所有的代码给大家。这段代码是基于tensorflow1.0+anaconda+苹果的mac系统+pycharm环境搭建的。import

2017-05-05 21:48:21 412

原创 android学习资料汇总

进入android应用开发已经半年,这是一些基本的学习资料与大家分享!

2017-03-28 13:11:20 2283 1

android蓝牙4.0通信实现

安卓手机蓝牙4.0与蓝牙模块的通讯实现,真实可用

2017-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除