JING0981
码龄6年
关注
提问 私信
  • 博客:20,274
    20,274
    总访问量
  • 7
    原创
  • 1,291,009
    排名
  • 8
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2018-10-19
博客简介:

JING0981的博客

查看详细资料
个人成就
  • 获得16次点赞
  • 内容获得7次评论
  • 获得24次收藏
创作历程
  • 9篇
    2018年
成就勋章
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

代理头部代理ip获取网页内容

import requestsfrom bs4 import BeautifulSoupimport chardetimport randomimport timedef getHtml(url):#准备一个网址url=‘http://www.baidu.com’#获取响应网页response=requests.get(url)#获取编码code=chardet.detect...
原创
发布博客 2018.11.28 ·
3237 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

爬取蛋壳数据

#!/usr/bin/env python# -- coding: utf-8 -from gethtml import getHtmlfrom urllib import requestfrom bs4 import BeautifulSoupimport relv=[]for i in range(108):print(‘正在...
原创
发布博客 2018.11.28 ·
553 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

存储csv数据到mysql

#!/usr/bin/env python-- coding: utf-8 -import csvimport pymysqlconn = pymysql.connect(host=‘localhost’, user=‘root’, password=‘1234’, db=‘danke’, charset=“utf8”)cursor = conn.cursor()with open(‘...
原创
发布博客 2018.11.28 ·
286 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python爬虫 selector xpath提取网页内容

xpath提取网页内容 selector模块XML 节点选择表达式 描述nodename 选取此节点的所有子节点。/ 从根节点选取。// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。. 选取当前节点。… 选取当前节点的父节点。@ 选取属性。bookstore 选取 bookstore 元素的所有子节点。/bookstore 选取根元素 bookstore。boo...
原创
发布博客 2018.11.28 ·
1472 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 爬虫 提取文本之BeautifulSoup详细用法

beautifulsoup的使用 bs4模块准备代码信息,用来练习获取内容:from bs4 import BeautifulSoup#准备代码信息,用来练习获取内容html =’’’The Dormouse's story 123456 The Dormouse's story aaaaa The Dormouse's storya Once u...
原创
发布博客 2018.11.28 ·
1549 阅读 ·
0 点赞 ·
0 评论 ·
9 收藏

python 爬虫 访问网页之request与requests:

准备头部和代理user_agent = [ #准备头部,列表“Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50”,“Mozilla/5.0 (Windows; U; Windows NT 6.1;...
原创
发布博客 2018.11.28 ·
8228 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

从Python中连接数据库写入数据和读取数据以及存储到excel中

写入mysql#!/usr/bin/env python-- coding: utf-8 -import pymysqlconn = pymysql.connect(host=‘IP’,user=‘用户名’,password=‘密码’,db=‘数据库’,charset=“utf8”)cursor = conn.cursor()#建立游标cursor当前的程序到数据之间连接管道sql =...
原创
发布博客 2018.10.20 ·
4292 阅读 ·
7 点赞 ·
3 评论 ·
17 收藏

Python中的正则

import re‘’’re.compile(string[, flags])re.match(pattern, string[, flags])re.search(pattern, string[, flags])re.split(pattern, string[, maxsplit])re.findall(pattern, string[, flags])re.finditer(...
转载
发布博客 2018.10.20 ·
344 阅读 ·
4 点赞 ·
2 评论 ·
0 收藏

Python抓取网页之urllub2 urllib

import urllib2import urllib1、抓取网页response = urllib2.urlopen(“http://www.baidu.com/”)print response.read()‘’’分析:response = urllib2.urlopen(“http://www.baidu.com/”)调用urllib2的urlopen方法,传入一个url,这个...
转载
发布博客 2018.10.20 ·
313 阅读 ·
4 点赞 ·
2 评论 ·
0 收藏