chenzao123
码龄9年
关注
提问 私信
  • 博客:39,660
    社区:1
    39,661
    总访问量
  • 8
    原创
  • 610,328
    排名
  • 12
    粉丝
  • 0
    铁粉

个人简介:All growth is a leap in the dark

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:美国
  • 加入CSDN时间: 2016-06-14
博客简介:

chenzao123的博客

查看详细资料
个人成就
  • 获得22次点赞
  • 内容获得2次评论
  • 获得90次收藏
创作历程
  • 8篇
    2018年
成就勋章
TA的专栏
  • 爬虫
    6篇
  • python数据分析
  • 全栈web开发
  • MySQL
  • python语言
    2篇
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python中执行shell脚本之subprocess模块

一. 最近subprocess使用背景和介绍    因为最近领导要求,在Python端调用大数据的shell脚本,所以需要用到Python来执行shell脚本, 因此需要查看下subprocess模块文档。    根据官网文档描述:subprocess模块用于创建子进程, 这个模块用于替换旧版本中的一些模块, 如:os.system,     os.spawn*, os.popen*, os.po...
原创
发布博客 2018.07.15 ·
22880 阅读 ·
7 点赞 ·
0 评论 ·
49 收藏

python3如何获取网页中使用了base64编码的图片

一. Base64介绍    Base64是一种用64个字符来表示任意二进制数据的编码方法, 常用在于URL, Cookie, 网页中传输少量二进制数据。二. base64图片示例    以某一网站上的验证码为例,这是一张进行了Base64编码的PNG图片。 示例网站地址            这张验证码图片,并不是从url加载过来, 而是通过base64编码嵌入在网页中。    查看base64...
原创
发布博客 2018.04.07 ·
7835 阅读 ·
5 点赞 ·
1 评论 ·
26 收藏

python3爬虫Selenium学习心得

一. 介绍    Selenium是一个Web自动化测试工具,支持多种编程语言,支持跨浏览器的自动化测试工具。    Selenium在爬虫中一般应用在动态网页的内容经过加密后,并且JavaScript代码混淆,肉眼很难读取完成。这种情况下使用selenium来模拟浏览器解析Javascript, 再爬取被解析以后的内容。python版的selenium官方文档。二 使用   1. demo演示 ...
原创
发布博客 2018.03.09 ·
845 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python3爬虫开发存储数据的几种必知必会

python存储数据简述        在实际开发过程中,会遇到数据存储的问题,我们需要针对不同的项目背景和开发需求采用不同的存储方式,从而满足项目开发需求和提高我们学习和工作效率。1. txt文件存储2. csv文件    csv(comma-separated values) -->逗号分隔值    文件以纯文本形式存储表格数据(数字和文本),在windows下可以用excel打开,cs...
原创
发布博客 2018.03.08 ·
2901 阅读 ·
5 点赞 ·
0 评论 ·
14 收藏

python爬虫中正则表达式学习心得以及典型实例

一 正则表达式简介    regular expression --> 用来简洁表达一组字符串的表达式    主要用于:文本处理 --> 如(表达文本类型的特征,同时查找或替换一组字符串,匹配字符串的全部或部分)二 正则表达式常用操作符操作符描述操作符描述\w匹配字母数字及下划线^匹配字符串开头\W匹配非字母数字下划线$匹配字符串末尾\s匹配任意空白字符,等价于[\t
\f].匹配任...
原创
发布博客 2018.03.06 ·
1036 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python爬虫Requests库:学习心得

一 Requests的介绍    requests官网   爬取网页最好的python库,官网描述:Requests is an elegant and simple HTTP library for Python, built for human beings.二 安装方法    直接使用:pip install requests三 Requests基本使用    1. Requests库的7个...
原创
发布博客 2018.03.05 ·
1782 阅读 ·
3 点赞 ·
0 评论 ·
25 收藏

python面试常问的几个内置装饰器:@staticmethod、@classmethod和@property

       之前在python笔试的时候,经常会遇到@staticmethod、@classmethod和@property的用法和区别,这三个也是python的内置装饰器,所以再来总结下:@staticmethod类静态方法与实例方法的区别是没有self参数,并且可以在类不进行实例化的情况下调用@classmethod类方法与实例方法的区别是接收的第一个参数不是self(类实例的指针),而是c...
原创
发布博客 2018.03.02 ·
1451 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

python3个人爬虫之:BeautifulSoup学习心得

一 Beautiful Soup的介绍    官网介绍:Beautiful Soup是一个可以从HTML或者XML文件中提取数据的Python库,能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式,Beautiful Soup 会帮你节省数小时甚至数天的工作时间。    简而言之:就是一种强大的解析工具,帮助我们从网页中提取数据时提高效率。  【tips】: BeautifulSoup...
原创
发布博客 2018.03.01 ·
927 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏