2018年10月_villaaaaaaa

12月 11月 10月 09月 08月 07月

原创 Janjia2模板引擎

Janjia2模板引擎python的Web开发中，业务逻辑(实质就是视图函数的内容)和页面逻辑(html文件)分开的，使得代码的可读性增强，代码容易理解和维护；模板渲染: 在html文件中，通过动态赋值，将重新翻译好的html文件(模板引擎生效) 返回给用户的过程。其他的模板引擎: Mako, Template, Jinja21.python自带的模块import str...

2018-10-29 20:30:01 715

原创 Flask框架基础

Flask框架基础Flask是一个Python编写的Web 微框架，让我们可以使用Python语言快速实现一个网站或Web服务。一.flask基础绪论1.安装flaskpip install flask2.导入Flask类from flask import Flask3.实例化一个Flask对象app = Flask(__name__)4.基本路由:通过路由绑定一个视图...

2018-10-29 20:11:29 276

原创详解使用Python爬取豆瓣短评并绘制词云

使用Python爬取豆瓣短评并绘制词云成果如下(比较丑，凑合看)1.分析网页打开想要爬取的电影，比如《找到你》，其短评如下:查看源代码发现短评存放在<span>标签里并且class为short，所以通过爬取其里边的内容即可并且通过翻页发现：url改变的仅仅为start,每次翻页增加20，所以只需for循环增加数字即可控制页数2.获取其网页内容我们使用bs...

2018-10-29 18:59:00 4546 7

原创 Python中的BS4模块

Python中的bs4模块bs4 模块的 BeautifulSoup 可以用来爬取html页面的内容，配合requests库可以用于简单的爬虫。1. 获取标签内容# 1. 获取标签内容from bs4 import BeautifulSoup# 构造对象soup = BeautifulSoup(open('villa.html'), 'html.parser')# 获取标签, ...

2018-10-23 18:31:13 2483

原创 Python中的requests模块

Python中的Requests模块Requests模块是一个用于网络访问的模块，类似的模块有urllib，urllib2，httplib，httplib2等，但由于其访问http时的人性化，便于操作，深受人们喜欢。在爬虫中常使用的模块：获取网页内容的----- urllib, requests分析网页常用的模块------ re, bs4(beautifulsoup4)1. 实例引入...

2018-10-23 17:46:29 745

原创 Python破解反爬虫的两种方法

Python破解反爬虫的两种方法由于有很多企业为了减轻网页负荷，抵御爬虫爱好者，设置了许多方法阻挡爬虫，本人也只是个菜鸡，目前只会两种方法绕过反爬虫机制，本文也就只列出这两种方法。1.伪装浏览器由于爬虫多直接由python脚本直接访问网页，部分企业也就由此建立了识别来访者是否为Python脚本访问，所以，我们可以使用伪装浏览器的方式对此种防御方式进行破解。from urllib.req...

2018-10-22 21:01:28 16782

原创 Python爬虫与正则表达式

Python爬虫与正则表达式一.Python中通配符的使用1.表示方式表示意义*匹配0到任意字符?匹配单个字符.当前..当前的上一级[0-9]0到9的任意一个数字[a-z]a到z的任意一个字母[A-Z]A到Z的任意一个字母[a-zA-Z]a到z或者A到Z之间的任意一个字母注意：以下内容在Linux Shel...

2018-10-22 20:33:08 1483 1

原创批量爬取豆瓣短评并批量生成词云

批量爬取豆瓣短评并批量制作为词云我分为两步实现获取短评和制作词云1.批量爬取豆瓣短评from bs4 import BeautifulSoupimport requestsimport threading# 获取网页信息def moviesInfo(): # 1). 获取页面信息 url = &quot;https://movie.douban.com/cinema/no...

2018-10-20 09:38:32 1309

原创 JavaScript基础

JavaScript基础JavaScript 是属于网络的脚本语言，被数百万计的网页用来改进设计、验证表单、检测浏览器、创建cookies，以及更多的应用。一.JS简介1.注册表单校验雏形1. 需求: 1). 用户在注册的时候会输入一些信息，但是用户输入的内容有可能不合法，会导致服务器端压力过大; 2). 当用户填写信息之后，对填写的信息进行校验（前端校验，只能防...

2018-10-19 18:22:00 209

原创 CSS样式及引入方式

CSS样式及引入方式CSS 指层叠样式表 (Cascading Style Sheets)样式定义如何显示 HTML 元素样式通常存储在样式表中把样式添加到 HTML 4.0 中，是为了解决内容与表现分离的问题外部样式表可以极大提高工作效率外部样式表通常存储在 CSS 文件中多个样式定义可层叠为一一.块级元素与行内标签1. 学习的行内标签和块级元素分别有哪些?行内标签:...

2018-10-18 18:14:23 491

原创 Python练习(十一)——爬虫练习

一. 爬取所有银行的银行名称和官网地址，并写入数据库。import refrom urllib.request import urlopenfrom urllib import requestimport pymysqldef get_content(url): """ 获取网页内容 :param url: :return: """ u...

2018-10-12 23:24:11 368

原创 HTML标签与表格

HTML标签与表格HTML(Hyper Text Markup Language,超文本标记语言)是用来描述网页的一种语言。主要结构为<html><body><!--<body> 与 </body> 之间的文本是可见的页面内

2018-10-09 21:12:53 335

全国行政区地图sql文件，各省市区（县）sql文件

包含省市区县相关信息，通过id、pid进行关联，包含长途区号、邮政编码、经度纬度等信息

2022-01-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人