Python
文章平均质量分 71
夏末的初雪
知乎id: 迷路森林
展开
-
Window下安装Scrapy
官方文档是这样说的:所以对Windows用户这里建议安装Python2.7,如果你的电脑之前已经安装了Python3+,因为目前Windows用户还不能支持python3+安装Scrapy,所以可以去官网下载2.7版本的安装,Python各版本之间是相互独立的,并不排斥,安装之后要重新设置Python2.7的环境变量,否则系统会默认用Python3+版本的。这里Python2.7安装在C盘中,原创 2016-11-08 16:16:27 · 1232 阅读 · 0 评论 -
Python爬虫实现验证码登录
很多网站为了避免被恶意访问,需要设置验证码登录,避免非人类的访问,Python爬虫实现验证码登录的原理则是先到登录页面将生成的验证码保存下来,然后人为输入后,包装后再POST给服务器,实现验证,这里还涉及到了Cookie,其实Cookie保存在本地主机上,避免用户重复输入用户名和密码,在连接服务器的时候将访问连接和Cookie组装起来POST给服务器。这里涉及到了两次向服务器POST,一次是Coo原创 2016-11-13 15:17:13 · 17379 阅读 · 0 评论 -
Python语言关于文件操作
江山如此多娇,我却如此暴躁~~~OK,现在的楼楼学了点什么就想搬上来,这样等牙齿掉光光回头看的时候会觉得很充实吧!!Python的文件系统,按照目前理解的来写,不愿做代码的搬运工写列出几个python的题目来,嘻嘻1,输入:某一个路径 在当前路径下查找的文件名 输出:待查找文件的完整路径2,统计当前目录下每个文件类型的文件数原创 2016-11-01 20:43:44 · 906 阅读 · 0 评论 -
DBSCAN算法的Python实现
当我傻傻的用python写DBSCAN,我才突然想起来在scikit-learn中有DBSCAN,可以直接调用啊,我本来想要放弃快完成的代码,但是我想我可以发博客啊,好吧!# -*- coding: utf-8 -*-import pandas as pdimport mathclass Point: def __init__(self,x,y,visited=Fal原创 2017-03-19 11:38:19 · 2477 阅读 · 2 评论 -
NLTK在去停用词、分词、分句以及词性标注的使用
因为实习的缘故,所以有机会接触到了自然语言处理的一些方面。这里主要总结一下在python环境下进行自然语言处理的相关包和可能会出现的相关错误,目前接触的都比较Low,但是还是想要记录下来。Nltk是python下处理语言的主要工具包,可以实现去除停用词、词性标注以及分词和分句等。安装nltk,我写python一般使用的是集成环境EPD,其中有包管理,可以在线进行安装。如果不是集成环境,原创 2017-03-09 22:16:06 · 30220 阅读 · 1 评论 -
Python中Json文件的读入和写入以及simplejson
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript ProgrammingLanguage, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++,原创 2017-03-09 23:02:03 · 1867 阅读 · 0 评论 -
一个递归算法
这是为了铭记如何把代码写的漂亮。敬大神~我最终想要得到的效果是这样的:‘水心病 latin_name 糖化病水心病 latin_name 蜜果病水心病 symptoms harm plants 果心水心病 symptoms harm plants 果面等等这个的思想利用动态规划来做,我们需要在判断类型的前提下来进行递归,一直找到最终的Value值,然后把当前原创 2017-03-17 21:52:23 · 390 阅读 · 0 评论 -
pygame中几个重要模块
最近总觉得自己在道上开始跑偏了,但是那又怎么样呢?即便我是做数据挖掘的,但是我还是觉得python真的好有意思,我接触到了python的游戏模块,发现它是如此的神奇,神奇如我,神奇的存在,下面就开始我们美妙的旅程了吧因为python 的game模块只能安装在32位python上,首先要检测一下我们安装的python是多少位的。在IDEL上敲import platformplatform原创 2016-11-19 21:22:31 · 45394 阅读 · 6 评论