![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
no-96
这个博客留给10年后的自己
展开
-
Python一些常见的字符串处理函数
切片切片功能的实现通过[start:end:step] start指定从字符串的第几个索引开始切片,start从0开始计 end切片结束的索引,但不包括end,采用左开右闭的原则 step是跳跃的间隔str1 = 'hello world'str1[4:9] # 'o wor'str1[:4] # 'hell'str1[2:] # 'llo world'str1 = 'abc原创 2017-07-08 19:17:52 · 687 阅读 · 0 评论 -
requests库的基础使用
项目地址https://github.com/No-96/FengSpider"""requests的基础用法"""import requestsurl_ip = 'http://httpbin.org/ip'url_github = "https://github.com/timeline.json"url_headers = 'http://httpbin.org/headers'u原创 2017-11-18 08:52:29 · 212 阅读 · 0 评论 -
No matching distribution found for win32api
Python是没有自带访问windows系统API的库的,需要下载。库的名称叫pywin32,可以从网上直接下载。 以下链接地址可以下载:http://sourceforge.net/projects/pywin32/files%2Fpywin32/ (下载适合你的Python版本)原创 2017-11-30 23:00:22 · 7824 阅读 · 0 评论 -
Windows上安装Scrapy
Scrapy文档Scrapy Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬原创 2017-11-25 22:11:58 · 415 阅读 · 0 评论 -
pymongo
环境描述Python 3.6.3pip 9.0.1Windows 10安装pip install pymongo与数据库建立连接from pymongo import MongoClient # 导入包user = "root" # 连接的用户名password = "123456" # 密码host = "localhost" # 连接的数据库主机uri = "mongodb://原创 2017-12-14 16:15:41 · 407 阅读 · 0 评论 -
Python3.6使用tesseract-ocr的正确姿势
环境Python 3.6.3pip 9.0.1tesseract-ocr-setup-3.05.00dev.exeWindows10安装1.tesseract-orc Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。安装的时候需要自行选择安装的语言,一些其他国家的语言原创 2017-12-17 13:59:45 · 37357 阅读 · 3 评论 -
豆瓣影评数据抓取
抓取豆瓣影评评分正常的抓取分析请求的urlhttps://movie.douban.com/subject/26322642/comments?start=20&limit=20&sort=new_score&status=P&percent_type=里面有用的也就是start和limit参数,我尝试过修改limit参数,但是没有效果,可以认为是默认的 start参数是用来设置从第几条数据开原创 2017-11-22 20:02:36 · 10061 阅读 · 5 评论 -
Python 爬虫资源包整理
项目地址:https://github.com/No-96/FengSpiderPython 爬虫资源包整理网络通用urllib -网络库(stdlib)。requests -网络库。grab – 网络库(基于pycurl)。pycurl – 网络库(绑定libcurl)。urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。httplib2 – 网络库。转载 2017-10-23 20:25:47 · 888 阅读 · 0 评论 -
京东手机图片爬取
环境:Python3.6 + BeautfulSoup4 爬取目标:京东手机图片https://list.jd.com/list.html?cat=9987,653,655思路首先打开目标网页https://list.jd.com/list.html?cat=9987,653,655 查看网页获取发送的GET请求的特征,对比第二页的URL https://list.jd.com/list.h原创 2017-10-13 17:15:23 · 1837 阅读 · 0 评论 -
拉勾网数据爬取
拉勾网数据爬取爬取内容北京数据挖掘方向的岗位数据方案正常的https://www.lagou.com/jobs/list_数据挖掘?px=new&city=上海#order上面的URL是查询上海数据挖掘岗位的信息并按照最新发布排序 通过抓包分析请求的真正URL是这个https://www.lagou.com/jobs/positionAjax.json原创 2018-01-22 22:14:24 · 7906 阅读 · 4 评论 -
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 44-46: ordinal not in range(
UnicodeEncodeError: ‘latin-1’ codec can’t encode characters in position 44-46: ordinal not in range(256)python连接MySQL的时候我也是日狗了,出现了这个错误。网上好多说什么,需要改字符集,资质愚钝不知道他们在说什么,尝试之后还是不行,最后上Stack Overflow解决pymysql.原创 2017-10-12 20:46:44 · 4156 阅读 · 0 评论 -
Django Temples中的注意点
模板一般放在app下的templates中,Django会自动去这个文件夹中找。但 假如我们每个app的templates中都有一个 index.html,当我们在views.py中使用的时候,直接写一个 render(request, ‘index.html’),Django 能不能找到当前 app 的 templates 文件夹中的 index.html 文件夹呢?(答案是不一定能,有可能找错)原创 2017-09-20 21:00:04 · 465 阅读 · 0 评论 -
TypeError: 'module' object is not callable
源码import Stack # 括号匹配def match(i,j): opens = '([{' closes = ')]}' return opens.index(i) == closes.index(j)def syntaxChecker(string): stack = Stack() balanced = True for i in st原创 2017-07-31 09:23:56 · 514 阅读 · 0 评论 -
Python数据结构--单链表
# 节点类class Node(): __slots__=['_item','_next'] # 限定Node实例的属性 def __init__(self,item): self._item = item self._next = None # Node的指针部分默认指向None def getItem(self): ret原创 2017-07-31 09:26:51 · 322 阅读 · 0 评论 -
Python数据结构--栈
class Stack(object): def __init__(self): self.stack = [] # 判断栈是否为空 def isEmpty(self): return self.stack == [] # push压栈操作 def push(self,item): self.stack.append原创 2017-07-31 09:27:54 · 240 阅读 · 0 评论 -
用Python处理Excel——xlrd的简单使用
xlrd主要用于读取Excel文件安装pip install xlrdapi使用import xlrd# 打开Excel文件读取数据workbook = xlrd.open_workbook('a.xlsx');# 打印所有的sheet列出所有的sheet名字print(workbook.sheet_names())# 根据sheet索引或者名称获取sheet内容Data_sheet = w原创 2017-09-06 18:06:00 · 1106 阅读 · 0 评论 -
Python中创建二维数组
Python中的列表list可以当做一维数组使用,但是没有直接的定义使用二维数组。如果直接使用a = [][]会产生SyntaxError: invalid syntax语法不正确错误。一般Python中创建二维数组的方法是使用列表解析的方法 列表解析将for循环和创建新元素的代码合并成一行,并自动附加新元素创建一个3行4列的数组,并初始化数组元素为1a = [[1 for j in rang原创 2017-09-15 19:45:26 · 3326 阅读 · 1 评论 -
Windows Django
安装Python 安装git 安装Django 1 去Python官网下载Python3.6并配置好环境变量 Python下载地址:https://www.python.org/ 配置环境变量:右键我的电脑->属性->更改设置->高级设置->环境变量。在Path环境变量中添加Python的安装路径 2 安装git,然后下载最新的Django编译文件git clone http原创 2017-09-18 09:34:29 · 555 阅读 · 0 评论 -
Python3.6简单的操作Mysql数据库
安装pymysql参考https://github.com/PyMySQL/PyMySQL/pip install pymsql实例一import pymysql# 创建连接# 参数依次对应服务器地址,用户名,密码,数据库conn = pymysql.connect(host='127.0.0.1', user='root', passwd='123456', db='demo')# 创建游标原创 2017-09-12 08:44:36 · 636 阅读 · 0 评论 -
Django&views.py&urls.py
简介views.py 处理用户发出的请求,从urls.py中对应过来, 通过渲染templates中的网页可以将显示内容,比如登陆后的用户名,用户请求的数据,输出到网页。urls.py 网址入口,关联到对应的views.py中的一个函数(或者generic类),访问网址就对应一个函数。案例1.建立一个新的项目django-admin startproject project_name通过原创 2017-09-20 09:41:13 · 713 阅读 · 0 评论 -
Django&templates
模板使用的基本步骤如下准备工作想要使用Django的模板功能,首先需要将创建的app注册到settings.py的INSTALLED_APPS中INSTALLED_APPS = (## 自带的 'django.contrib.admin', 'django.contrib.auth', 'django.contrib.contenttypes', 'django.c原创 2017-09-20 20:56:12 · 356 阅读 · 0 评论 -
Python 格式化输出整理
字符串格式化输出format方式 格式[[fill]align][sign][#][0][width][,][.precision][type] 参数fill 【可选】空白处填充的字符align 【可选】对齐方式(需配合width使用) <,内容左对齐>,内容右对齐(默认)=,内容右对齐,将符号放置在填充字符的左侧,且只对数字类型有效。 即使:符号+填充物+数字^内容居中sig原创 2018-03-02 16:33:07 · 2195 阅读 · 0 评论