排序:
默认
按更新时间
按访问量

用Python编写C\C++代码统计工具

代码参考:https://foofish.net/how-to-count-code.html import os def parse(path): in_multi_comment = False comments,blanks,codes = 0,0,0 ...

2017-12-22 09:39:55

阅读数:107

评论数:0

2种方法简单爬取JS加载的动态数据

参考原文:http://www.cnblogs.com/buzhizhitong/p/5697683.html 需要爬取的网站数据: http://gkcx.eol.cn/soudaxue/queryProvince.html?page=1 一共是165页,将page=1 变成其他的数字...

2017-12-02 11:51:18

阅读数:3042

评论数:0

python实现12306验证和登录

原文地址:http://blog.csdn.net/sinat_36772813/article/details/76804799 1.获取验证码 分析:这里可以看出验证码的获取地址,最后一个参数不知道是什么意思,我们直接去掉,然后发现在浏览器中仍然能请求到验证码。...

2017-12-01 16:43:42

阅读数:1092

评论数:3

用Python下载音悦台最清晰版mv

import re import requests import urllib.request def getHtml(url): page = requests.get(url) html =page.text return html def mv...

2017-11-26 21:02:42

阅读数:159

评论数:0

使用selenium下载煎蛋网加密妹子图

#!/usr/bin/env python # -*- coding: utf-8 -*- #coding=utf-8 import requests import urllib.request from bs4 import BeautifulSoup from selenium i...

2017-11-26 16:36:40

阅读数:622

评论数:0

爬取百度贴吧所有精品贴照片

#coding=utf-8 import os import random import requests from lxml import etree from urllib.parse import urlparse import urllib.request as urllib from b...

2017-11-16 19:12:58

阅读数:204

评论数:0

爬取百度贴吧某帖子的所有照片

#coding=utf-8 import random import requests import urllib.request as urllib from lxml import etree from bs4 import BeautifulSoup user_agent_list = [...

2017-11-16 14:07:01

阅读数:193

评论数:0

《流畅的Python》第一章学习笔记

1.1 一摞Python风格的纸牌 Python 解释器碰到特殊的句法时,会使用特殊方法去激活一些基本的对象操作,这些特殊方法的名 字以两个下划线开头,以两个下划线结尾(例如__getitem__)。比如 obj[key] 的背后就是 __getitem__ 方法,为了能求得...

2017-11-15 11:27:00

阅读数:178

评论数:0

selenium实战二:登入QQ空间

from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.keys import Keys P...

2017-11-14 22:38:29

阅读数:190

评论数:0

selenium实战一:播放音悦台高清Mv

from selenium import webdriver from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.keys import Keys P...

2017-11-14 22:36:17

阅读数:88

评论数:0

Xpath实战四:W3S网上的例子

#coding=utf-8 import requests from lxml import etree def getHtml(url): headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; r...

2017-11-14 10:25:37

阅读数:97

评论数:0

Xpath实战三:下载煎蛋网妹子照片

#coding=utf-8 import requests import urllib.request from lxml import etree def getHtml(url): headers = {'User-Agent': 'Mozilla/5.0 (Windows NT...

2017-11-13 20:40:41

阅读数:294

评论数:0

Xpath实战二:下载百度贴吧的照片

#coding=utf-8 import requests import urllib.request from lxml import etree def getHtml(url): page = requests.get(url) html =page.text ...

2017-11-13 20:14:47

阅读数:85

评论数:0

Xpath实战一:解析爬取糗事百科段子

#coding=utf-8 import requests from lxml import etree def getHtml(url): page = requests.get(url) html = page.text return html def ...

2017-11-13 19:43:58

阅读数:132

评论数:0

Python爬虫实战(十一):两种简单的方法爬取动态网页

#一网页POST方式 #coding=utf-8 import requests from bs4 import Tag from bs4 import BeautifulSoup from prettytable import PrettyTable def getHt...

2017-11-07 19:21:57

阅读数:567

评论数:0

Python爬虫实战(十):爬取Linux公社资源站的所有电子资源

#coding=utf-8 import re import requests from tenacity import retry, stop_after_attempt @retry(stop=stop_after_attempt(3)) def get_html(url): '''...

2017-11-04 15:16:50

阅读数:418

评论数:0

Python爬虫实战(九):爬取动态网页

#coding=utf-8 import re import json import requests from prettytable import PrettyTable def getHtml(url): data = { 'page':1, 'n...

2017-10-29 22:50:15

阅读数:163

评论数:0

Python爬虫实战(八):爬取电影天堂的电影下载链接

#coding=utf-8 import re import requests import xlsxwriter from bs4 import BeautifulSoup def getHtml(url): headers = {'User-Agent': 'Mozilla/5.0...

2017-10-29 18:15:01

阅读数:465

评论数:0

Python学习笔记(三):常用内置函数学习

一.如何查看Python3的所有内置函数 命令:dir(__builtins__) 效果如下: dir(__builtins__) ['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 'B...

2017-09-15 11:27:28

阅读数:415

评论数:0

Python学习笔记(二):tuple属性及方法浅析

元组是存放任意元素集合,不能修改其内容. 简单创建元组 In [1]: T = () #创建一个空的元组 In [2]: T Out[2]: () In [3]: T = tuple() #创建一个空的元组 In [4]: T Out[4]: () In [...

2017-09-14 17:41:45

阅读数:292

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭