IT～子民-CSDN博客

原创 Scrapy框架总结

目录：一.Scrapy框架简介二.Scrapy框架的安装三.Scrapy框架中各组件的介绍及之间的关系四.Scrapy运行流程五.Scrapy框架项目的创建及运行六.Scrapy框架项目结构七.Scrapy框架详细应用&实战项目八.Scrapy框架的特殊用法九.总结一.Scrapy框架简介：为了爬取网站数据而编写的一款应用框架,所谓的框架其实就是一...

2019-12-11 21:56:45 749

原创 python爬虫---bs4解析方式

一.环境安装：需要安装：lxml pip install lxml bs4 pip install bs4二.基础用法:from bs4 import BeautifulSoup使用方式：可以将一个html文档，转化为BeautifulSoup对象，然后通过对象的方法或者属性去查找指定的内容（1）转化本地文件： ...

2019-12-11 12:50:22 335

原创 python爬虫--正则解析方式

一.正则解析：提取数据步骤：创建正则对象-->匹配查找-->提取数据保存；知识点：1.单字符： . : 除换行以外所有字符 [] ：[aoe] [a-w] 匹配集合中任意一个字符 \d ：数字 [0-9] \D : 非数字 \w ：数字、字母、下划线、中文 ...

2019-12-11 11:31:21 340

原创网络爬虫基本原理

阅读目录一、爬虫是什么二、爬虫的基本流程三、http协议和https协议的区别四、request与Response之间的关系五、 request请求以及常用请求方式六、Response响应七、总结一.爬虫是什么？互联网是什么？互联网是由一个个站点和网络设备组成的，通过浏览器访问站点，站点把HTML、JS、CSS代码返回给浏览器，这些代码经过浏览器解析...

2019-12-10 21:38:30 2813 1

原创 python数据分析之--numpy库

numpy库是数据分析的基础包，提供高性能的数组与矩阵运算处理能力；优点：1.Numpy的强大之处-向量化操作;2.NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵;3.Python自身的嵌套列表(nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix））;4.ndarray在存储数据的时候，数据与数据的地...

2019-11-11 13:14:41 358

原创 pandas索引操作（增删改查）

#一：索引对象#Series的索引和DataFrame的行和列索引都是索引对象；#索引对象不可以进行修改In[23]:obj2.indexOut[23]:Index(['a', 'b', 'c', 'd'], dtype='object')In[24]:df.indexOut[24]:RangeIndex(start=0, stop=4, ste...

2019-10-30 11:40:33 888

原创 pandas数据结构

#一：series数据结构类似于一维数组（一组数据一组索引）from pandas import Series,DataFrameimport pandas as pdIn[2]:obj = Series([1,2,-8,9])objOut[2]:0 11 22 -83 9dtype: int64In[4]:#Series数...

2019-10-29 21:27:41 229

原创小费&消费&pandas可视化

小费数据集来源python第三方库seaborn中自带数据；一：数据导入import numpy as npfrom pandas import Series,DataFrameimport pandas as pdimport seaborn as sns #导入seaborn库中自带数据In[6]:tips = sns.load_dataset('tips')ti...

2019-10-29 09:31:58 1487

原创利用pillow库的图像变换

from PIL import Imageimport numpy as npim = np.array(Image.open('C:\\Users\\LT\\Desktop\\img\\01.jpg'))print(im.shape,im.dtype)>>(1080, 1920, 3) uint8im>>array([[[ 4, 1, 0],...

2019-10-27 15:03:48 511

原创 python爬取数据--存储mysql数据库

一.安装mysql：在官网：https://dev.mysql.com/downloads/mysql/二.安装驱动程序：在python集成开发环境Anaconda下，需用命令：pip3 install pymysql或conda install pymysql安装。三.连接数据库:#建立mysql数据库连接import pymysqlconn = pymysql....

2019-10-18 22:02:34 914

原创爬取数据存储于Excel表

一.利用pandas库直接存储为Excel文件；主要技术点： 1.首先建立列表，存储每一次爬取的内容，为后面的字典存储做准备； 2.利用字典格式储存数据； 3.利用pandas中DataFrame()函数保存字典数据并利用to_excel()函数储存到exel表格中；应用举例一：(菜鸟教程python100例url)from lxml...

2019-10-18 20:07:43 1317 1

原创 python爬虫---css选择器

css选择器是什么？要使用css对HTML页面中的元素实现一对一，一对多或者多对一的控制，这就需要用到CSS选择器。HTML页面中的元素就是通过CSS选择器进行控制的。 CSS选择器主要用于选择需要添加样式的元素。css选择器的详细用法：#container:选择id为container的节点.container:选取所有class包含container的节点...

2019-05-13 12:30:00 758

原创 python爬虫--xpath解析语法

什么是Xpath？Xpath 是一门在XML或者html文档中导航查找信息的语法，对HTML有很好的支持 xpath 是一个w3c的标准；xpath 包含标准库；Xpath语法的详细用法？1.节点关系（层次关系） 2.节点选择 2.1节点选择表达式：nodename |/ |// |. |.. |@nodename: 选取此节点的所有子节点 ...

2019-05-13 12:27:02 1548 1

原创爬虫url去重策略&字符串编码

一.爬虫url去重策略将访问过的url保存到数据库中；将访问过得url保存到set中，只需要o(1)的代价就可以查询url url 经过md5的编码等方法哈希后保存到set中（scrapy采用此方法）用bitmap方法，将访问过的url通过hash函数映射到某一位 Bloomfilter方法对bitmap进行改进，多重hash函数降低冲突；ps:从字面上理解，url去重即去除...

2019-05-13 12:24:48 411

转载 WEB前端和后端开发面临的挑战

　WEB前端和后端开发面临的挑战　　要成为一名高效的Web开发者，这需要我们做很多工作，来提高我们的工作方式，以及改善我们的劳动成果。而在开发中难免会遇到一些困难，从前端到后端，近日，在问答网站知乎上，有人抛出了“Web前端开发面临的挑战主要有哪些?”和“后端开发主要的挑战有哪些?”。　　一、Web前端开发所面临的挑战　　盛大Web工程师曹刘阳：前端语言的胶水性需求太强 ...

2018-08-02 17:39:29 3234

原创 html5和css 初步学者应用笔记

HTML 超文本标记语言标签：是由一对 <> 构成的，有开始、有结束。html架构：<!doctype html><html><head>网页的名称、网页的样式css、网页相关的js、网页的编码</head><body>书写要学习的标签（内容）</body></html>例子1：&a

2018-07-07 23:03:52 305

基于Django的大学生学习社交问答网站的设计与实现.docx

利用python开发的大学学习社交网站过程论文

2021-09-17

《南京邮电大学考研数据结构(811)00-09年真题和答案》

南京邮电大学考研数据结构(811)00-09年真题和答案

2023-11-16

Linux 内核服务器中搭建训练深度学习算法模型环境

无论在企业还是科研实验室，都需要借用服务器环境（由于服务器在单位内网，此处应用内网穿透工具）进行算法模型的训练，此处总结了如何在以 linux 为内核的服务器下搭建训练深度学习算法模型环境及相关的步骤操作。

2023-09-17

【面试必备】全网最火的100道 Python 面试题！.pdf

python面试题，金九银十，可以快速回忆以前学习的基础知识；Stackoverflow上关于 Python的问题，文档包含问题的提问排行，排名根据 vote 数量选取, 许多 SO上的回答质量确实高,有能力建议查看原文,一般引用的文章也非常好。该内容来源于网络。

2020-08-11

mysql-5.7.23-1.el6.x86_64.rpm-bundle.tar

mysql-5.7.23-1.el6.x86_64.rpm-bundle安装包，在centos下安装；

2020-09-12

cookiecutter的安装.docx

Linux环境下cookiecutter的安装流程及注意事项

2021-09-17

numpy库是数据分析的基础包，提供高性能的数组与矩阵运算处理能力；优点： 1.Numpy的强大之处-向量化操作; 2.NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵; 3.Python自身的嵌套列表(nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix））; 4.ndarray在存储数据的时候，数据与数据的地址都是连续的，这样就给使得批量操作数组元素时速度更快;

2019-11-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_42633222的博客