自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (9)
  • 收藏
  • 关注

原创 Scrapy框架总结

目录:一.Scrapy框架简介 二.Scrapy框架的安装 三.Scrapy框架中各组件的介绍及之间的关系 四.Scrapy运行流程 五.Scrapy框架项目的创建及运行 六.Scrapy框架项目结构 七.Scrapy框架详细应用&实战项目 八.Scrapy框架的特殊用法 九.总结一.Scrapy框架简介:为了爬取网站数据而编写的一款应用框架,所谓的框架其实就是一...

2019-12-11 21:56:45 668

原创 python爬虫---bs4解析方式

一.环境安装:需要安装:lxml pip install lxml bs4 pip install bs4二.基础用法:from bs4 import BeautifulSoup使用方式:可以将一个html文档,转化为BeautifulSoup对象,然后通过对象的方法或者属性去查找指定的内容 (1)转化本地文件: ...

2019-12-11 12:50:22 272

原创 python爬虫--正则解析方式

一.正则解析: 提取数据步骤:创建正则对象-->匹配查找-->提取数据保存;知识点:1.单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非数字 \w :数字、字母、下划线、中文 ...

2019-12-11 11:31:21 296

原创 网络爬虫基本原理

阅读目录一、爬虫是什么 二、爬虫的基本流程 三、http协议和https协议的区别 四、request与Response之间的关系 五、 request请求以及常用请求方式 六、Response响应 七、总结一.爬虫是什么? 互联网是什么?互联网是由一个个站点和网络设备组成的,通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析...

2019-12-10 21:38:30 2535 1

原创 python数据分析之--numpy库

numpy库是数据分析的基础包,提供高性能的数组与矩阵运算处理能力;优点:1.Numpy的强大之处-向量化操作;2.NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵;3.Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix));4.ndarray在存储数据的时候,数据与数据的地...

2019-11-11 13:14:41 315

原创 pandas索引操作(增删改查)

#一:索引对象#Series的索引和DataFrame的行和列索引都是索引对象;#索引对象不可以进行修改In[23]:obj2.indexOut[23]:Index(['a', 'b', 'c', 'd'], dtype='object')In[24]:df.indexOut[24]:RangeIndex(start=0, stop=4, ste...

2019-10-30 11:40:33 805

原创 pandas数据结构

#一:series数据结构 类似于一维数组(一组数据一组索引)from pandas import Series,DataFrameimport pandas as pdIn[2]:obj = Series([1,2,-8,9])objOut[2]:0 11 22 -83 9dtype: int64In[4]:#Series数...

2019-10-29 21:27:41 190

原创 小费&消费&pandas可视化

小费数据集来源python第三方库seaborn中自带数据;一:数据导入import numpy as npfrom pandas import Series,DataFrameimport pandas as pdimport seaborn as sns #导入seaborn库中自带数据In[6]:tips = sns.load_dataset('tips')ti...

2019-10-29 09:31:58 1312

原创 利用pillow库的图像变换

from PIL import Imageimport numpy as npim = np.array(Image.open('C:\\Users\\LT\\Desktop\\img\\01.jpg'))print(im.shape,im.dtype)>>(1080, 1920, 3) uint8im>>array([[[ 4, 1, 0],...

2019-10-27 15:03:48 449

原创 python爬取数据--存储mysql数据库

一.安装mysql:在官网:https://dev.mysql.com/downloads/mysql/二.安装驱动程序: 在python集成开发环境Anaconda下,需用命令:pip3 install pymysql或conda install pymysql安装。三.连接数据库:#建立mysql数据库连接import pymysqlconn = pymysql....

2019-10-18 22:02:34 859

原创 爬取数据存储于Excel表

一.利用pandas库直接存储为Excel文件; 主要技术点: 1.首先建立列表,存储每一次爬取的内容,为后面的字典存储做准备; 2.利用字典格式储存数据; 3.利用pandas中DataFrame()函数保存字典数据 并利用to_excel()函数储存到exel表格中;应用举例一:(菜鸟教程python100例url)from lxml...

2019-10-18 20:07:43 1168 1

原创 python爬虫---css选择器

css选择器是什么? 要使用css对HTML页面中的元素实现一对一,一对多或者多对一的控制,这就需要用到CSS选择器。HTML页面中的元素就是通过CSS选择器进行控制的。 CSS选择器主要用于选择需要添加样式的元素。css选择器的详细用法:#container:选择id为container的节点.container:选取所有class包含container的节点...

2019-05-13 12:30:00 667

原创 python爬虫--xpath解析语法

什么是Xpath?Xpath 是一门在XML或者html文档中导航查找信息的语法,对HTML有很好的支持 xpath 是一个w3c的标准;xpath 包含标准库;Xpath语法的详细用法?1.节点关系 (层次关系) 2.节点选择 2.1节点选择 表达式:nodename |/ |// |. |.. |@nodename: 选取此节点的所有子节点 ...

2019-05-13 12:27:02 1412 1

原创 爬虫url去重策略&字符串编码

一.爬虫url去重策略将访问过的url保存到数据库中; 将访问过得url保存到set中,只需要o(1)的代价就可以查询url url 经过md5的编码等方法哈希后保存到set中(scrapy采用此方法) 用bitmap方法,将访问过的url通过hash函数映射到某一位 Bloomfilter方法对bitmap进行改进,多重hash函数降低冲突;ps:从字面上理解,url去重即去除...

2019-05-13 12:24:48 330

转载 WEB前端和后端开发面临的挑战

 WEB前端和后端开发面临的挑战  要成为一名高效的Web开发者,这需要我们做很多工作,来提高我们的工作方式,以及改善我们的劳动成果。而在开发中难免会遇到一些困难,从前端到后端,近日,在问答网站知乎上,有人抛出了“Web前端开发面临的挑战主要有哪些?”和“后端开发主要的挑战有哪些?”。   一、Web前端开发所面临的挑战   盛大Web工程师 曹刘阳:前端语言的胶水性需求太强 ...

2018-08-02 17:39:29 2408

原创 html5和css 初步学者应用笔记

HTML 超文本 标记 语言标签:是由一对 <> 构成的,有开始、有结束。html架构:<!doctype html><html><head>网页的名称、网页的样式css、网页相关的js、网页的编码</head><body>书写要学习的标签(内容)</body></html>例子1:&a

2018-07-07 23:03:52 242

《南京邮电大学考研数据结构(811)00-09年真题和答案》

南京邮电大学考研数据结构(811)00-09年真题和答案

2023-11-16

Linux 内核服务器中搭建训练深度学习算法模型环境

无论在企业还是科研实验室,都需要借用服务器环境(由于服务器在单位内网,此处应用 内网穿透工具)进行算法模型的训练,此处总结了如何在以 linux 为内核的服务器下搭建训练深度学习算法模型环境及相关的步骤操作。

2023-09-17

MySQL集群详细架设步骤及SQL节点负载均衡实现.pdf

MySQL集群详细架设步骤及SQL节点负载均衡实现

2021-09-17

cookiecutter的安装.docx

Linux环境下cookiecutter的安装流程及注意事项

2021-09-17

基于Django的大学生学习社交问答网站的设计与实现.docx

利用python开发的大学学习社交网站过程论文

2021-09-17

数据分析爬虫(五八同城)案例.7z

python多线程爬取五八同城案例

2021-09-16

牛客网剑指offer66题思路分析.rar

剑指offer

2021-09-16

wenba-master.rar

Diango项目——大学生学习社交问答网站

2021-09-16

mysql-5.7.23-1.el6.x86_64.rpm-bundle.tar

mysql-5.7.23-1.el6.x86_64.rpm-bundle安装包,在centos下安装;

2020-09-12

【面试必备】全网最火的100道 Python 面试题!.pdf

python面试题,金九银十,可以快速回忆以前学习的基础知识;Stackoverflow上关于 Python的问题,文档包含问题的提问排行,排名根据 vote 数量选取, 许多 SO上的回答质量确实高,有能力建议查看原文,一般引用的文 章也非常好。该内容来源于网络。

2020-08-11

numpy知识库.html

numpy库是数据分析的基础包,提供高性能的数组与矩阵运算处理能力; 优点: 1.Numpy的强大之处-向量化操作; 2.NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵; 3.Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)); 4.ndarray在存储数据的时候,数据与数据的地址都是连续的,这样就给使得批量操作数组元素时速度更快;

2019-11-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除