Python
文章平均质量分 58
fat_summer
这个作者很懒,什么都没留下…
展开
-
Python3 爬虫拉勾网抓取数据保存在Excel中
操作环境:Python 3.6、Pycharm 2017.2.3前言本人渣渣一枚,为爬虫拉勾网获取数据,将获得的数据保存在Excel中,这中间的过程大概花费了我两天的时间(捂脸),期间参考了很多博客,自己也一直在探索,终于折腾出来了,现在一步步地把步骤写出来。步骤一 – 分析拉勾网1、首先打开拉勾网,然后借助Chrome浏览器的开发工具进行分析,即按F12,记得勾上Presev...原创 2018-02-23 15:38:35 · 1984 阅读 · 3 评论 -
Python 爬虫实战(1):分析豆瓣中最新电影的影评并制作词云
入门Python不久,想做个小项目练练手,碰巧最近一部国产电影《红海行动》反响不错,便萌生想法去抓取一下它最新的评论,并制作词云,来看看网页对这部电影的一些评价,接下来就是开始分析啦(分析过程也参考了很多其他博主的博文,原凉我个渣渣。。。)操作环境:Python 3.6、Pycharm 2017.2.3一、抓取网页数据第一步就是要对你所要抓取的网页进行访问,获取网页内容,Pytho...原创 2018-02-28 14:58:15 · 2566 阅读 · 0 评论 -
Python3 爬虫糗事百科
'''--------------------------------------- 程序:糗百爬虫 语言:Python 3.6 操作:输入quit退出阅读糗事百科 功能:按下回车依次浏览今日的糗百热点 ---------------------------------------'''import urllib.request import re...原创 2018-02-08 19:00:40 · 206 阅读 · 0 评论 -
Python每日练习 05 任一个英文的纯文本文件,统计其中的单词出现的个数
#任一个英文的纯文本文件,统计其中的单词出现的个数import rewith open(r'C:\Users\summer\Documents\python.txt', 'r') as f: dictResult = {} for line in f.readlines(): listMatch = re.findall('[a-zA-Z]+',转载 2018-01-20 15:43:02 · 1246 阅读 · 0 评论 -
Python每日练习 04 你有一个目录,装有很多图片,现在你要把它们的尺寸变成不都大于Iphone5分辨率的大小
#你有一个目录,装有很多图片,现在你要把它们的尺寸变成不都大于Iphone5分辨率的大小import osfrom PIL import ImagepathDir='C:/Users/summer/Pictures/echo'os.chdir(pathDir)def modify_imgsize(): for filename in get_imglist():转载 2018-01-19 11:22:46 · 370 阅读 · 0 评论 -
Python每日练习 14 15 16 将某txt的内容写入到xls文件中
#将某txt的内容写入到xls文件中#打开源文件目录,读取文件,解析成json格式,再按要求写入xls中import jsonimport xlwtfrom collections import OrderedDictdef run_1(): with open ('student.txt','r') as f:#打开文件 content = f.read()原创 2018-01-26 17:33:32 · 981 阅读 · 0 评论 -
Python 每日练习 03 把将随机生成的200 个激活码保存在mysql中
#!/usr/bin/env python3# -*- coding: utf-8 -*-# 将0001题目中随机生成的200个验证码保存到MySQL数据库import uuidimport pymysql# 生成 num 个验证码,每个长度为length,可设置默认长度def create_num(num, length=16): result = [] wh转载 2018-01-17 13:32:25 · 409 阅读 · 0 评论 -
Python每日练习 10 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-)
# 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-)from urllib import requestfrom bs4 import BeautifulSoupimport redef get_pic(): html = request.urlopen(r'http://tieba.baidu.com/p/2166231880') page原创 2018-01-25 09:08:21 · 1083 阅读 · 0 评论 -
Python每日练习 09 敏感词查找以及替换
#敏感词文本文件 filtered_words.txt,里面的内容为以下内容,当用户输入敏感词语时,则打印出 Freedom,否则打印出 Human Rights'''def filtered_words(): user_words = input('Please input your words:') for f in open('E:/Users/summer/Pychar原创 2018-01-24 19:17:26 · 6618 阅读 · 0 评论 -
Pyhton每日练习 08 使用 Python 生成类似于下图中的字母+数字验证码图片
#使用 Python 生成类似于下图中的字母+数字验证码图片from PIL import Image,ImageDraw,ImageFont,ImageFilterimport randomimport string#随机获取四个字母def get_random_char(length =4): chars = string.ascii_letters + string.di原创 2018-01-23 13:28:50 · 1791 阅读 · 0 评论 -
Python每日练习 02 用python随机生成200个激活码
1.直接生成#用python随机生成200个激活码import random, string#String模块ascii_letters和digits方法,其中ascii_letters是生成所有字母,从a-z和A-Z,digits是生成所有数字0-9def rand_str(num, length=7): for i in range(num): char原创 2018-01-15 13:32:13 · 1145 阅读 · 0 评论 -
Python每日练习 07 一个HTML文件,找出里面的正文与链接
#一个HTML文件,找出里面的正文与链接import requestsfrom bs4 import BeautifulSoupdef search_body_urls(path): #path = 'http://mil.news.sina.com.cn/china/2017-04-05/doc-ifycwymx3854291.shtml' page = requests.原创 2018-01-22 19:29:43 · 1201 阅读 · 0 评论 -
Python 练习 06 有个目录,里面是你自己写过的程序,统计一下你写过多少行代码。包括空行和注释
#有个目录,里面是你自己写过的程序,统计一下你写过多少行代码。包括空行和注释import osimport reos.chdir('文件路径')fh=open('文件名', 'r', encoding='utf-8')read_fh=fh.readlines()fh.close()number_code=0number_empty=0number_note=0pattern转载 2018-01-21 15:30:44 · 1422 阅读 · 0 评论 -
Python每日练习 01 图像右上角添加数字
#导入模块from PIL import Image,ImageColor,ImageFont,ImageDrawdef add_num(img): #创建一个draw对象,对图片进行画图操作 draw = ImageDraw.Draw(img) #创建一个font,主要设置字体的类型(我这里采用的是windows下fonts文件夹中的某一种字原创 2018-01-14 14:01:59 · 1485 阅读 · 1 评论 -
python3.6 学习笔记之安装PIL
安装环境:Python 3.6.3PIL(Python Image Library)是python 的一个强大的图像处理库,不过只支持到python2.7pillow是PIL的一个派生分支,如今已发展成比PIL更具活力的图像处理库本次安装使用pip命令查看python的版本安装pillow步骤如下:1、以管理员运行命令提示符,首先原创 2017-11-26 16:42:09 · 4628 阅读 · 0 评论