自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (7)
  • 收藏
  • 关注

原创 selenium直接"刚"淘宝登录

     现在爬取淘宝商品必须要登录,不登录爬取商品的时候会自动重定向到登录页面,也看过许多人用selenium等自动化框架模拟登录淘宝,但是淘宝可以检测出你使用的是selenium,然后无论怎么滑块验证都失败。然后前几天看到使用pyppeteer这个异步登录淘宝,确实是可以躲过淘宝的检测,就是不是很熟悉,这个语法,导致我看不动例子,在这里问问大家,这个是什么意思,知道的评论下,谢谢。sli...

2018-12-25 09:46:53 9777 7

转载 python操作redis数据库

https://www.cnblogs.com/melonjiang/p/5342505.html

2018-12-17 21:49:39 2348 1

原创 神奇的反爬措施--大众点评

大众点评的店面详细信息比如地址,电话号码,评分等一系列的数字在f12下都找不到 只有1这个数字显示,其他的都被莫名其妙的标签占据。其实破解这个很简单,我开始以为是在页面源代码中显示(script标签内),发现并么有,只有地址是在页面内源代码显示;然后我觉得是请求ajax,就寻找新的请求里的看看是否返回了相应的信息,发现也没有;再然后我觉得是在js的加密,使...

2018-12-10 22:46:22 4460 3

原创 加速爬虫:异步加载asyncio

         之前就一直想学习asyncio,然后就去网上查,发现讲的花里胡哨而且异常难懂,就放弃了一段时间,今天来重新学习一下,发现了一个大佬的文章,根据例子来理解就容易多了,文章最后放上大佬的连接。             传统的单线程下载处理网页可能就像下图(来源)左边蓝色那样, 计算机执行一些代码, 然后等待下载网页, 下好以后, 再执行一些代码… 或者在等待的时候, 用另...

2018-12-01 14:51:38 3067 1

python选择题.rar

1.对python基础知识的选择题,填空题,以及其他问题 2.选择题,填空题含有答案,其他可能没有答案,需要自行查阅 3.资源绝对良心

2020-05-04

四川大学874计算机综合资源

包含四川大学874学科的参考资源,例如数据结构,计算机网络,操作系统等教学课件,习题等中多资源,绝对超值,值的下载。

2019-05-04

python大战机器学习pdf

内容简介 · · · · · · 数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。 Python 是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。 《Python大战机器学习:数据科学家的第一个小目标》以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python 编程实践,采用“原理笔记精华+ 算法Python 实现+ 问题实例+ 代码实战+ 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。 《Python大战机器学习:数据科学家的第一个小目标》从内容上分为13 章分4 篇展开:第一篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k 近... (展开全部) 作者简介 · · · · · · 华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。 目录 · · · · · · 第一篇机器学习基础篇 1 第 1章线性模型 .................................................. 2 1.1概述 2 1.2算法笔记精华 2 1.2.1普通线性回归 2 1.2.2广义线性模型 5 1.2.3逻辑回归 5 1.2.4线性判别分析 7 1.3 Python实战 10 1.3.1线性回归模型 11 1.3.2线性回归模型的正则化 12 1.3.3逻辑回归 22 1.3.4线性判别分析 26 第 2章决策树 .................................................... 30 2.1概述 30 2.2算法笔记精华 30 2.1决策树原理 30 2.2构建决策树的 3个步骤 31 CART算法 37 2.4连续值和缺失值的处理 42 2.3 Python实战 43 2.3.1回归决策树(DecisionTreeRegressor) 43 2.3.2分类决策树(DecisionTreeClassifir) 49 2.3.3决策图 54 第 3章贝叶斯分类器.............................................. 55 3.1概述 55 3.2 算法笔记精华55 3.2.1 贝叶斯定理55 3.2.2 朴素贝叶斯法56 3.3 Python 实战59 3.3.1 高斯贝叶斯分类器(GaussianNB) 61 3.3.2 多项式贝叶斯分类器(MultinomialNB) 62 3.3.3 伯努利贝叶斯分类器(BernoulliNB) 65 3.3.4 递增式学习partial_fit 方法69 第4 章k 近邻法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.1 概述70 4.2 算法笔记精华70 4.2.1 kNN 三要素70 4.2.2 k 近邻算法72 4.2.3 kd 树73 4.3 Python 实践74 第5 章数据降维. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.1 概述83 5.2 算法笔记精华83 5.2.1 维度灾难与降维83 5.2.2 主成分分析(PCA) 84 5.2.3 SVD 降维91 5.2.4 核化线性(KPCA)降维91 5.2.5 流形学习降维93 5.2.6 多维缩放(MDS)降维93 5.2.7 等度量映射(Isomap)降维96 5.2.8 局部线性嵌入(LLE) 97 5.3 Python 实战99 5.4 小结118 第6 章聚类和EM 算法. . . . . . . . . . . . .

2018-10-20

跟着老齐学Django

第1章 简单的博客系统 1 1.1 Django起步 1 1.1.1 Django简介 1 1.1.2 安装Django 3 1.1.3 创建项目 4 1.1.4 创建应用 6 1.1.5 网站配置 11 1.1.6 知识点 12 1.2 编写博客的数据模型类 12 1.2.1 数据模型类 13 1.2.2 发布博客文章 17 1.2.3 知识点 21 1.3 显示博客信息 23 1.3.1 显示文章标题 24 1.3.2 查看文章内容 28 1.3.3 知识点 32 第2章 用户管理 35 2.1 自定义模板和静态文件位置 35 2.1.1 自定义模板位置 36 2.1.2 自定义静态文件位置 36 2.1.3 通用静态文件和基础模板 37 2.1.4 重置管理后台模板 40 2.1.5 知识点 42 2.2 用户登录 43 2.2.1 创建应用 44 2.2.2 理解表单类 45 2.2.3 登录的视图函数 47 2.2.4 登录的前端界面 49 2.2.5 知识点 53 2.3 用内置方法实现登录和退出 54 2.3.1 内置的登录方法 55 2.3.2 判断用户是否登录 58 2.3.3 内置的退出方法 59 2.3.4 知识点 60 2.4 用户注册 62 2.4.1 简单注册 62 2.4.2 增加注册内容 65 2.4.3 管理新增的注册内容 70 2.4.4 知识点 71 2.5 关于密码的操作 72 2.5.1 修改密码 73 2.5.2 重置密码 78 2.5.3 利用第三方应用重置密码 84 2.5.4 知识点 87 2.6 维护个人信息 88 2.6.1 个人信息的数据模型类和表单类 88 2.6.2 展示个人信息 90 2.6.3 编辑个人信息 93 2.6.4 上传和裁剪头像图片 97 2.6.5 优化头像上传功能 105 2.6.6 对个人信息进行管理 107 2.6.7 知识点 108 第3章 文章管理和展示 110 3.1 管理文章栏目 110 3.1.1 设置栏目 110 3.1.2 编辑栏目 118 3.1.3 删除栏目 120 3.1.4 知识点 122 3.2 发布和显示文章 125 3.2.1 简单的文章发布 126 3.2.2 使用Markdown 131 3.2.3 文章标题列表 133 3.2.4 知识点 140 3.3 删除和修改文章 141 3.3.1 删除 142 3.3.2 修改 143 3.3.3 设置分页功能 147 3.3.4 知识点 149 3.4 文章展示 151 3.4.1 新写文章标题列表 151 3.4.2 重新编写“查看文章”功能 155 3.4.3 知识点 156 第4章 拓展网站功能 158 4.1 梳理已有功能 158 4.1.1 修改导航栏 158 4.1.2 修改登录和注册后的跳转 159 4.1.3 知识点 161 4.2 查看作者全部文章 161 4.2.1 查看某作者的文章列表 162 4.2.2 知识点 165 4.3 为文章点赞 167 4.3.1 修改数据模型类 167 4.3.2 编写视图函数 168 4.3.3 修改模板文件 169 4.3.4 知识点 172 4.4 文章的阅读次数 173 4.4.1 安装Redis 174 4.4.2 在Python中使用Redis 175 4.4.3 记录阅读次数 176 4.4.4 显示最“热”文章 177 4.4.5 知识点 179 4.5 文章的评论功能 180 4.5.1 数据模型类和表单类 180 4.5.2 实现评论功能 181 4.5.3 知识点 184 4.6 多样化显示 185 4.6.1 统计文章总数 186 4.6.2 最新发布的文章 188 4.6.3 评论最多的文章 189 4.6.4 自定义模板选择器 192 4.6.5 知识点 193 4.7 管理和应用文章标签 195 4.7.1 管理文章标签 195 4.7.2 发布文章时选择标签 200 4.7.3 在文章中显示文章标签 202 4.7.4 推荐相似文章 202 4.7.5 知识点 204 第5章 收集和展示图片 206 5.1 收集网络图片 206 5.1.1 创建图片相关类 207 5.1.2 收集和管理图片 210 5.1.3 完善图片管理功能 214 5.1.4 知识点 218 5.2 展示图片 219 5.2.1 瀑布流方式展示图片 219 5.2.2 查看图片的详细信息 223 5.2.3 知识点 224 第6章 中场休整 226 第7章 创建在线学习应用 227 7.1 基于类的视图 227 7.1.1 最简类视图 228 7.1.2 读取数据 230 7.1.3 初步了解Mixin 232 7.1.4 知识点 233 7.2 管理课程标题 234 7.2.1 判断用户是否登录 235 7.2.2 创建课程 237 7.2.3 删除课程 239 7.2.4 知识点 243 7.3 发布和学习课程内容 245 7.3.1 课程内容的数据模型 246 7.3.2 课程内容的表单类 249 7.3.3 课程内容的视图 250 7.3.4 查看课程内容 252 7.3.5 注册学习课程 257 7.3.6 知识点 260 第8章 结束和开始 262

2018-09-09

大数据相关技术学习视频

一共四十多天课程,详细教学,从基础进行授课。大小修改日期 08.文件常用操作命令.avi 450.9M2018-07-20 10:45 05.vmware虚拟网络的配置介绍.avi 252.8M2018-07-20 10:45 01.基础部分课程介绍.avi 187.6M2018-07-20 10:45 06.linux网络配置及CRT远程连接.avi 140.8M2018-07-20 10:45 02.linux系统安装过程.avi 471M2018-07-20 10:45 03.linux图形界面及文件系统结构介绍.avi 143.3M2018-07-20 10:45 07.回顾上午的ip地址配置.avi 63.7M2018-07-20 10:45 11.ssh免密登陆配置.avi 133M2018-07-20 10:45 10.常用系统操作命令.avi 352.3M2018-07-20 10:45 09.文件权限的操作.avi 214.2M2018-07-20 10:45 04.局域网工作机制和网络地址配置.avi 315M2018-07-20 10:45

2018-07-21

hadoop段海涛老师八天实战视频

第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-hadoop集群搭建的无密登陆配置.avi 第二天 hdfs的原理和使用操作、编程 01-NN元数据管理机制.avi 02-NN工作机制2.avi 03-DN工作原理.avi 04-HDFS的JAVA客户端编写.avi 05-filesystem设计思想总结.avi 06-hadoop中的RPC框架实现机制.avi 07-hadoop中的RPC应用实例demo.avi 08-hdfs下载数据源码跟踪铺垫.avi 09-hdfs下载数据源码分析-getFileSystem.avi 10-hdfs下载数据源码分析-getFileSystem2.avi 第三天 mapreduce的原理和编程 01-hdfs源码跟踪之打开输入流.avi 02-hdfs源码跟踪之打开输入流总结.avi 03-mapreduce介绍及wordcount.avi 04-wordcount的编写和提交集群运行.avi 05-mr程序的本地运行模式.avi 06-job提交的逻辑及YARN框架的技术机制.avi 07-MR程序的几种提交运行模式.avi 08-YARN的通用性意义.avi 09-yarn的job提交流程.avi 第四天 常见mr算法实现和shuffle的机制 01-复习.avi 02-hadoop中的序列化机制.avi 03-流量求和mr程序开发.avi 04-hadoop的自定义排序实现.avi 05-mr程序中自定义分组的实现.avi

2018-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除