![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python学习
阿优乐扬
阿优乐扬是一种追求,一种标准,一种态度,一种精神;阿以至优,乐享于扬!2017级贵州财经大学信息学院学生,主修专业信息管理与信息系统,辅修专业金融学。学习方向为数据挖掘与数据分析,欢迎交流学习13124677419
展开
-
python 正则表达式常用表达总结
文章目录1、删除字符串中的 Python注释2、截取某符号前后的内容3、删除非数字的字符串4、只保留中文5、只保留中文、大小写字母和阿拉伯数字6、去掉大小写字母和数字7、去掉某个特殊字符8、保留英文,数字和特殊符号1、删除字符串中的 Python注释案例:import re time = "2020-01-01 # 这是一个日期"num = re.sub(r'#.*$', "", tim...原创 2020-01-05 16:16:12 · 621 阅读 · 0 评论 -
Python 多线程执行原理
python threading是python的内置库,不需要重新安装这个库,直接导入就可以使用。python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用。多线程的目的就是让CUP同时执行多个算法,对单核或同时执行程序大于CPU内核的电脑,它使用优先级调度,并不是真的同时执行。只是电脑的计算速度每秒就几万次,超出人眼...原创 2019-09-27 10:25:52 · 476 阅读 · 0 评论 -
python selenium使用百度搜索框搜索的几种方式
selenium有个功能就是可以指挥浏览器,模拟用户使用,比如使用百度自动搜索。实现的几种方式:打开百度官网,找到搜索框,使用右键检查功能,找到输入框的节点<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">百度的输入框就在input这个标签中,其属性有c...原创 2019-08-14 19:33:28 · 6864 阅读 · 0 评论 -
Python Scrapy使用Selector、xpath、css选择器提取数据
从页面中提取数据的核心技术是HTTP文本解析,在Python 中常用以下模块处理此类问题:BeautifulSouplxml非常流行的HTTP解析库,API 简洁易用,但解析速度较慢。由C语言编写的xml解析库( libxml2),解析速度更快,API相对复杂。Scrapy综合上述两者优点实现了Selector 类,它是基于lxml库构建的,并简化了API接口。在Sc...原创 2019-08-01 17:51:16 · 7238 阅读 · 0 评论 -
遍历文档树和搜索文档树常用的函数笔记
遍历文档树在BeautifulSoup中,一个标签Tag可能包含多个字符串和其他的标签,这些称为该标签的子标签。1、子节点在BeautifulSoup中通过contents值获取标签的子节点内容,并与列表的形式输出#-*-coding:utf-8-*-from bs4 import BeautifulSoupsoup = BeautifulSoup(open('G:/MyPoem.h...原创 2019-07-11 12:05:00 · 836 阅读 · 0 评论 -
2018~2019第二学年17级信管班杨秀璋老师《大数据技术及运用》课堂python代码学习汇总(第四部分)
1、网页基础<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta http-equ...原创 2019-07-05 20:03:11 · 490 阅读 · 1 评论 -
2018~2019第二学年17级信管班杨秀璋老师《大数据技术及运用》课堂python代码学习汇总(第三部分)
1、画曲线# coding:utf-8import numpy as npimport matplotlib.pyplot as plt#定义数组X = np.arange(3,10)print (X)#画图plt.plot(X, X*4, "r--", label="y=X*4")plt.plot(X, X*X+3, "b:", label="y=X*X+3")plt.p...原创 2019-07-05 19:41:27 · 345 阅读 · 0 评论 -
2018~2019第二学年17级信管班杨秀璋老师《大数据技术及运用》课堂python代码学习汇总(第二部分)
1、python定义类型print "abc"strl=raw_input("please input a string:")print (strl)print (type(strl))weight=raw_input("")print(weight)print(type(weight))cj=input("please input cj:")print(cj,type(c...原创 2019-07-05 19:02:44 · 299 阅读 · 0 评论 -
2018~2019第二学年17级信管班杨秀璋老师《大数据技术及运用》课堂python代码学习汇总(第一部分)
1、python基础输出1、 # -*- coding: utf-8 -*-2、 3、 print "fsadfsad"4、 a = 105、 print a6、 b = 2057、 print a, b8、 9、 c = a+b10、 print c11、 12、 c = a * b13、 print c14、 c = a / b15、 print c16、 ...原创 2019-07-05 18:39:38 · 398 阅读 · 0 评论 -
BeautifulSoup对象学习笔记
BeautifulSoup将复杂的HTML文档转化为一个树状结构,每个节点都是python对象,BeautifulSoup官方文档将所有对象总结为四种:TagNavigableStringBeautifulSoupcomment预设HTML为 G:/MyPoem.html ,下面将对它展开学习<!DOCTYPE html><html lang="en">...原创 2019-07-11 07:16:12 · 321 阅读 · 0 评论 -
杨友正则表达式学习笔记
正则表达式(Regular Expression,Regex或RE)又称为正则表达法或常规表达法,常用来检索、替换那些符合某个模块的文本。原创 2019-07-05 14:08:30 · 356 阅读 · 1 评论 -
BeautifulSoup基础学习笔记
BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python扩展库,是一个分析HTML或XML文件的解析器。它通过合适的转换器实现文档导航、查找、修改文档等功能;可以很好地处理不规范标记并生成剖析树(ParseTree);提供的导航功能(Navigating)可以简单、快速地搜索剖析树以及修改剖析树。Beau-tifulSoup技术通常用于分析网页结构,爬取相应的Web文档,...原创 2019-07-10 00:14:11 · 393 阅读 · 0 评论 -
正则表达式爬取贵州财经大学-信息学院官网
在学习完正则表达式、常用网络数据爬取模块、正则表达式爬取数据常见方法等内容之后,我将操作一个简单的正则表达式爬取网站的实例。这里我以爬取贵州财经大学-信息学院官网作为实战操作,网址“http://xxxy.gufe.edu.cn/normalView?par=subject&curItem=assessment” 打开如下图所示我需要实现爬取的内容如下:1.官网网址的标题(titl...原创 2019-07-09 01:37:26 · 835 阅读 · 0 评论 -
正则表达式爬取网页数据学习笔记
1、爬取title标签的内容采用的正则表达式为’(.<em>?)</em>’,(.?)就代表我们爬取的内容,以爬取百度首页title为例;爬取百度标题代码如下:# -*- coding: utf-8 -*- import reimport urlliburl = "http://www.baidu.com"content = urllib.urlopen(...原创 2019-07-08 22:08:08 · 2670 阅读 · 0 评论