python
文章平均质量分 71
wds2006sdo
这个作者很懒,什么都没留下…
展开
-
python 中文分词
最近要写一个计算两个句子相似度的程序,需要分词,因此上网找找有关Python分词的资料。看了别人的介绍,发现在python分词可选择中科院的分词和结巴分词,由于中科院分词要调用C++,所以我选择了结巴分词结巴分词速度还行,但没有停用词表。于是我将结巴分词包装了一下,加入百度停用词列表、哈工大停用词表扩展、四川大学机器智能实验室停用词库与中文停用词库这四个停用词库。结巴分词G原创 2016-03-31 20:04:31 · 5426 阅读 · 0 评论 -
Python 调用C++函数
传入两个int参数,返回int结果代码python 代码# encoding=utf8import ctypesll = ctypes.cdll.LoadLibrarylib = ll("cpp_test/x64/Release/cpp_test.dll")print lib.Add(1,3)MyDLL.cpp#include <iostream>using namespace std; #i原创 2016-11-16 20:16:00 · 4124 阅读 · 0 评论 -
Python 繁体中文与简体中文相互转换
工作中需要将繁体中文转换成简体中文 上网找了些资料,发现这个包最方便安装方法不需要什么安装方法,只需要把这两个文件下载下来,保存到与代码同一目录下即可 https://raw.githubusercontent.com/skydark/nstools/master/zhtools/langconv.py https://raw.githubusercontent.com/skydark/原创 2016-12-12 15:31:07 · 38390 阅读 · 3 评论 -
python 实现 softmax分类器(MNIST数据集)
最近一直在外面,李航那本书没带在身上,所以那本书的算法实现估计要拖后了。 这几天在看Andrew Ng 机器学习的课程视频,正好看到了Softmax分类器那块,发现自己之前理解perceptron与logistic regression是有问题的。这两个算法真正核心的不同在于其分类函数的不同,perceptron采用一个分段函数作为分类器,logistic regression采用sigmod函数原创 2016-12-16 21:54:12 · 17096 阅读 · 9 评论 -
优达学城 深度学习 任务1
这几天刚好有环境,打算学习一下深度学习 看了一圈介绍,发现优达学城的深度学习课程作为入门课程还是不错的 今天看了第一章节的视频,顺便做了任务1 任务1难度不大,按照网站上的说明可以完成下载、打包等工作 Problem 6 没有给代码,下面是我的代码,供大家参考import numpy as npimport picklefrom sklearn.linear_model import Lo原创 2016-12-20 22:02:43 · 7113 阅读 · 3 评论 -
李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集)
相关文章: 李航《统计学习方法》第二章——用Python实现感知器算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 看了第三章 k近邻法 (k-nearest neighbor, k-NN) , 发现KNN算法真的好适合在MNIST数据集上分类。因为KNN实际上就是一个少数服从多数的投票模型,所以可以用在多分类的原创 2016-07-17 16:42:32 · 25988 阅读 · 6 评论 -
李航《统计学习方法》第六章——用Python实现逻辑斯谛回归(MNIST数据集)
相关文章: - 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) - 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) - 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) - 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集)第六章有两个算法,分原创 2016-11-08 17:38:56 · 10205 阅读 · 10 评论 -
李航《统计学习方法》第六章——用Python实现最大熵模型(MNIST数据集)
相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py原创 2016-11-09 22:01:10 · 20607 阅读 · 9 评论 -
李航《统计学习方法》第七章——用Python实现支持向量机模型(伪造数据集)
相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py原创 2016-11-14 10:42:49 · 14368 阅读 · 11 评论 -
Python2 urllib2 与 Python3 urllib.request API对照
python2 python3 urllib2.urlopen() urllib.request.urlopen() urllib2.install_opener() urllib.request.install_opener() urllib2.build_opener() urllib.request.build_opener() urllib2.URLError原创 2016-10-04 02:26:58 · 8871 阅读 · 2 评论 -
Python正则表达式指南
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。转载自:http://www.cnblogs.com/huxi/archive/2010转载 2016-10-01 10:24:45 · 3523 阅读 · 0 评论 -
基于gensim模块的中文句子相似度计算工具
概述中文句子相似度的计算有很多模型,我们使用 TFIDF , LSI 与 LDA 模型这3中模型更加适用于文章相似度的计算对于句子来说,长度太短,正确率相对不高算法及代码具体这几种模型的原理介绍可以参考别人的博客(如果我有时间就找找)gensim包提供了这几个模型,因此我们直接拿来用就好我将这个模型进行了简单的封装,包括增加了中文分词分句,并提供清晰简洁的API原创 2016-04-05 00:27:08 · 14800 阅读 · 2 评论 -
发邮件自动回复本机IP——python版本
这几天在写爬虫,有时候在宿舍需要远程登陆到实验室的主机上对代码进行一些微调,但是因为动态ip经常不知道实验室主机的IP是多少,因此产生了写这个小工具的想法。 工作原理描述: 首先需要一个专用的邮箱,该工具每隔2分钟查询有没有新邮件。当用户向该邮箱发送邮件查询ip时,该工具接收邮件并获取本机IP,并将该IP发送给用户。 思路很清晰,需要解决的问题很明确 1) 接收邮件 2) 发送邮件 3) 获取I原创 2016-04-27 10:04:21 · 6191 阅读 · 0 评论 -
利用Scrapy爬取1905电影网
本文将从以下几个方面讲解Scrapy爬虫的基本操作Scrapy爬虫介绍Scrapy安装Scrapy实例——爬取1905电影网相关资料Scrapy 爬虫介绍Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据原创 2016-04-21 17:15:59 · 146850 阅读 · 3 评论 -
Leetcode 300 Longest Increasing Subsequence(Python)
题目大意确定一个未排序数组中最大上升子序列的长度算法很简单,没啥可说的。 就是维护一个数组A如果当前数num比数组A最后一个元素大,那么依旧构成一个上升序列,将其放到数组A最后。否则,二分查找数组A中第一个比num大的数,用num替换之最后数组A长度即为该未排序数组的最大上升子序列长度 但要注意该数组并不一定是最大上升子序列举例一个数组{3,6,2} 1. 输入3,此时LIS数组为[原创 2016-07-19 01:57:14 · 3933 阅读 · 1 评论 -
获取汉字偏旁部首 Python版本
功能介绍传入一个汉字,返回其偏旁部首字典分为本地字典与网络字典,本地词典来自精简版的新华字典,网络字典来自百度汉语。若当前汉字在本地字典中,则直接查询其偏旁部首并返回结果若本地字典中没找到,则到百度汉语中查找如果需要,可将网络字典中的结果加入本地字典中。代码下面两处都可以免费下载到源码 https://github.com/WenDesi/Chinese_radical http://do原创 2016-08-19 01:31:26 · 12868 阅读 · 0 评论 -
Jetbrains的产品对在校学生免费
转载自:http://blog.csdn.net/oncealong/article/details/49721727JetBrains 有个计划叫 Academic License Program,网址是https://www.jetbrains.com/student/。 在这个网址,只要你有学校里的edu账号,就可以申请到对应的免费试用时间。类似微软的spark计划。 有可能转载 2016-08-09 16:31:28 · 3019 阅读 · 0 评论 -
爬虫第三弹——利用EditThisCookie获取cookie跳过登陆验证(医脉通)
爬虫第一弹:利用Scrapy爬取1905电影网 爬虫第二弹:深网爬虫指南,AcFun评论爬取教程前言最近有个活,需要将约300个英文医学名词翻译成中文。 经过一番查找发现医脉通的词典还不错,但是必须要登陆后才能使用其词典功能。 这种工作量并不大的任务并不值得我们抓包与模拟登陆,太折腾了!! 我们其实只需要保存登陆成功的cookie,在每次请求时都附上该cookie即可! 这时就可以使用Ed原创 2016-10-10 20:31:40 · 20200 阅读 · 0 评论 -
Python 判断字符串中是否包含中文
转载自: http://zhidao.baidu.com/link?url=5mVtLl7qD_FSvAxxe_c2QtjrXspBvIEXd_jJyJF4XEbTEEXTbPC09OHiOK4btxEJvCPE1Bfx1gOGTRiDvCeOrLAsPxYGMB7fQTRv0xap4ea我稍微改了一下程序#!/usr/bin/python# -*- coding: utf-8 -*-import转载 2016-10-12 22:38:55 · 31877 阅读 · 0 评论 -
李航《统计学习方法》第八章——用Python+Cpp实现AdaBoost算法(MNIST数据集)
相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py原创 2016-11-17 09:31:19 · 14505 阅读 · 4 评论