掉进大海里over
码龄8年
关注
提问 私信
  • 博客:30,735
    社区:168
    30,903
    总访问量
  • 9
    原创
  • 2,399,307
    排名
  • 7
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:天津市
  • 加入CSDN时间: 2017-08-01
博客简介:

weixin_39695028的博客

查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得3次评论
  • 获得63次收藏
创作历程
  • 9篇
    2018年
成就勋章
TA的专栏
  • python
    7篇
  • 编程基础
    2篇
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python 对socket的理解

python socket创建客户端和服务器之间的链接。1、首先是服务器设置好了监听2、然后客户端发起响应请求3、服务器接收到响应请求,将信息发送给客户端4、循环往复,客户端发出请求,服务器根据请求反馈信息。所以,服务器和客户端的互动为:对服务器而言:import socketimport threading# 设置一个socket对象s = socket.socket(s...
原创
发布博客 2018.10.18 ·
210 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python pandas DataFrame的创建

import numpy as npimport pandas as pddf = pd.DataFrame({"a":[range(10)], "b":list(range(10,20))})
原创
发布博客 2018.07.09 ·
2847 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

AES加密算法

刚刚拜读两位大神的加密算法解释,做一个小记录。 https://blog.csdn.net/qq_28205153/article/details/55798628 https://blog.csdn.net/lrwwll/article/details/78069013加密说到底就是对原有明文进行处理,形成密文的过程。AES是当前最流行的加密手段。 根据密匙长度不同,可以分为128、1...
原创
发布博客 2018.07.04 ·
229 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

关于int、byte、bit,以及函数运行桟帧的问题

1、数据类型、byte、bit 编程中遇到很多数据类型,有int,char,float,bool等等。 数据类型往下是字节byte,比如一个int有4个byte大小,一个字符是一个byte,一个汉字是两个byte。 再往下,一个字节是4位bit。 一台机器的编译器可以是16位,或者是32位,所以int类型的大小就是不同的。除最高位的0表示正数,1表示负数外,那么最大值就是剩余位数全部为1。...
原创
发布博客 2018.06.28 ·
561 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

python struct模块

python struct模块用来进行C语言结构体和python语言的转换首先,我是从来没接触过C语言的小白,不知道语言结构体是什么。网上搜了一下,说说我的理解。C语言结构体的写法是#include <stdio.h>  struct student  //结构体类型的说明与定义分开。 声明{int age;   /*年龄*/float score;  /*分数*/char sex; ...
原创
发布博客 2018.06.28 ·
1363 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

python 带账号密码的爬取

某些网页需要输入账号密码才能进入到特定的页面,比如cdsn登陆之后才能进入自己的博客管理页面。 博客页面url:https://mp.csdn.net/postlist 登陆的方式有几种,如下具体描述。 假如没有输入用户名密码的原始爬取,代码import urllib.requesturl = "https://mp.csdn.net/postlist"headers = {'...
原创
发布博客 2018.05.13 ·
20577 阅读 ·
5 点赞 ·
1 评论 ·
55 收藏

python urllib设置代理服务器爬取数据

了解到爬虫在爬取时,有时会受到ip一定时间内访问数量的限制,按照网上大神的说法,应当设置通过代理服务器访问网页。我还没有爬取过那么庞大的数据,当前没遇到这个问题。这里只是把方法记录整体步骤为:1、设置代理服务器2、爬取数据设置代理服务器的方法为import urllib.requestdef set_proxy(): handler = urllib.request.ProxyHandl...
原创
发布博客 2018.05.11 ·
1113 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 爬取网页动态部分

有些网页在进行换页时,只是改动很小的部分,绝大多数位置不变,那么网页制作的过程中就不会更改初始的url,只是调整内部部分。这种改动我现在了解到的使用javascript来进行。js表现就是,在同一个url下,点击不同的查询页,出现不同的数据。比如评论的分页等。这个情况下,爬取的主体部分是不变的,需要调整的是url部分,需要找到正确的url。爬取过程仍然是1、通过url读取到网站网页2、将网站的文本...
原创
发布博客 2018.05.10 ·
3424 阅读 ·
3 点赞 ·
2 评论 ·
11 收藏

python urllib 静态网页的爬取

python之前有urllib和urllib2,在我接触到时已经合并,所以暂时不清楚之间的差别。现在只有urllib我暂时了解到的,爬虫的基本逻辑:1、通过url读取到网站网页2、将网站的文本数据读取3、通过正则表达寻找数据4、保存需要的数据5、数据处理,这里不是爬虫的内容所以爬虫入门就4个步骤:1、通过url打开网站from urllib import requesturl = "www.ba...
原创
发布博客 2018.05.09 ·
411 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏