python
HadwinLing
这个作者很懒,什么都没留下…
展开
-
python格式化输出
'''%用法1、整数的输出%o —— oct 八进制%d —— dec 十进制%x —— hex 十六进制'''def demoFunc(): print('%o' % 20) # 输出八进制 print('%d' % 20) # 输出十进制 print('%x' % 20) # 输出十六进制'''2、浮点数输出(1)格式化输出%f ——保留小数点后面六位有效数字 %.3f,保留3位小数位%e ——保留小数点后面六位有效数字,指数形式输出原创 2020-10-18 15:27:23 · 1785 阅读 · 0 评论 -
python基础学习——员工管理系统
emps = []def choiceFunc(): # 选择功能列表 print("*"*30) print("1.添加员工信息") print("2.删除员工信息") print("3.修改员工信息") print("4.查看单个员工信息") print("5.查看所有员工信息") print("6.退出") print("*"*30)def addEmpFunc(): """添加员工信息""" id = in原创 2020-10-18 14:58:21 · 2643 阅读 · 0 评论 -
数据分析——numpy
数组的创建一:array 创建数组语法格式:numpy.array(object,dtype =None,copy=True,order=None,subok=False,ndmin =0)array参数说明名称描述object数组或嵌套的数列dtype数组元素的数据类型,可选copy对象是否需要复制,可选order创建数组的样式,C 为行方向,F 为列方向,A 为任意方向(默 认)subok默认返回一个与基类类型一致的数组ndmin原创 2020-08-07 10:37:34 · 775 阅读 · 0 评论 -
数据分析——matplotlib
导入:from matplotlib import pyplot as plt设置中文字体:方式一:不具有通用性这个字体设置为全局设置font = {'family' : 'MicroSoft YaHei', 'weight': 'bold', 'size': '10'}matplotlib.rc("font",**font)matplotlib.rc("font",family='MicroSoft YaHei',weight="bold")方式二这原创 2020-08-05 17:36:50 · 174 阅读 · 0 评论 -
数据分析——matplotlib之直方图
# coding=utf-8from matplotlib import pyplot as pltfrom matplotlib import font_managerinterval = [0,5,10,15,20,25,30,35,40,45,60,90]width = [5,5,5,5,5,5,5,5,5,15,30,60]quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]print(len(interv原创 2020-08-05 17:36:16 · 298 阅读 · 0 评论 -
数据分析——matplotlib之条形图
# coding=utf-8from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STFANGSO.TTF")a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终原创 2020-08-05 17:33:45 · 309 阅读 · 0 评论 -
数据分析——matplotlib之散点图
# coding=utf-8from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STFANGSO.TTF")y_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,原创 2020-08-05 17:32:21 · 249 阅读 · 0 评论 -
数据分析——matplotlib之折线图
# coding=utf-8from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STFANGSO.TTF")y_1 = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]y_2 = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,原创 2020-08-05 17:30:49 · 200 阅读 · 0 评论 -
jupyter 使用规则
jupyter 使用规则代码文件的后缀名.ipynb ipython notebook jupyter 继承 ipythonjupyter中有运行单元,单元写代码,写代码的规则和Python完全一样状态栏Run,单击运行 Ctrl + Enter 运行 选中本单元 Alt + Enter 运行 插入新的一行 Shift + Enter 运行 选中下一个单元插入新的代码单元 a above 上面插入一行 b below 下面插入一行删除 双击Dtab代码提示代码方法A原创 2020-08-05 08:57:21 · 407 阅读 · 0 评论 -
初探python——代理
代理:破解封IP这种反爬机制。什么是代理:- 代理服务器。代理的作用:- 突破自身IP访问的限制。- 隐藏自身真实IP代理相关的网站:- 快代理- 西祠代理- www.goubanjia.com代理ip的类型:- http:应用到http协议对应的url中- https:应用到https协议对应的url中代理ip的匿名度:- 透明:服务器知道该次请求使用了代理,也知道请求对应的真实ip- 匿名:知道使用了代理,不知道真实ip- 高匿:不知道使用了代理,更不知道真实的ip示例原创 2020-07-29 20:57:45 · 185 阅读 · 0 评论 -
初探python——数据解析
聚焦爬虫:爬取页面中指定的页面内容。 - 编码流程: - 指定url - 发起请求 - 获取响应数据 - 数据解析 - 持久化存储数据解析分类: - 正则 - bs4 - xpath(***)数据解析原理概述: - 解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储 - 1.进行指定标签的定位 - 2.标签或者标签对应的属性中存储的数据值进行提取(解析.原创 2020-07-29 20:14:25 · 235 阅读 · 0 评论 -
初探python-文件处理
访问模式说明r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。w打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。wb以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆...原创 2020-07-29 14:55:04 · 110 阅读 · 0 评论 -
python-爬猫眼电影
import requestsfrom lxml import etreeimport re#1. 定义请求的urlurl = 'https://maoyan.com/news?showTab=3'#2. 定义请求头headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML,...原创 2020-02-10 14:35:40 · 239 阅读 · 0 评论 -
python-爬取有道翻译(更错)
import requestsdef fanyi(keyword): #定义请求的url url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' #定义请求的参数 data = { 'i':keyword, 'doctype'...原创 2020-02-10 14:32:24 · 555 阅读 · 5 评论 -
python爬取百度图片
import requestsimport os# 进行数据爬取def getPages(kw,num): # 循环页码数和 请求参数 params = [] for i in range(30,30*num+30,30): params.append({ 'tn': 'resultjson_com', ...原创 2020-02-08 15:15:43 · 259 阅读 · 0 评论 -
初探python爬虫(六)——中文乱码和UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 1004:
json中使用dump,在json文件中出现不是中文字样,可能是格式不对,该法:在json.dump()中加入 ensure_ascii=False如:json.dump(self.varlist, fp,ensure_ascii=False)在写入存储文件时如: with open ('E:/Learn/PythonLearn/demo02/text.html','w...原创 2020-02-06 19:08:41 · 550 阅读 · 0 评论 -
初探python爬虫(五)——bs4
安装cmd -》pip install BeautifulSoup使用import requestsfrom bs4 import BeautifulSoup# 定义html文档内容html_doc = """<html><head><title abc="123">The Dormouse's story</title></h...原创 2020-02-06 18:57:59 · 146 阅读 · 0 评论 -
初探python爬虫(四)——xpath
在爬虫时可以使用xpath做相应的信息抽取xpath常用规则表达式描述nodename选取此接待你的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点…选取当前子节点的父节点@选取属性安装cmd-》pip3 install lxml实例##第一种方式,直接再python代码中解析html字符串...原创 2020-02-06 18:49:49 · 261 阅读 · 0 评论 -
初探python爬虫(三)——cookie和session
##什么是cookiehttp请求是无状态的请求协议不会记住用户的状态和信息也不清楚你在者这之前的访问过什么因为网站需要记录用户是否登录时,就需要在用户登录后创建一些信息并且要把这些信息记录在当前用户的浏览器中,记录的内容就是cookie用户使用当前的这个浏览器继续访问这个服务器时,会主动携带这个网站设置的cookie信息cookie会在浏览器中记录信息,并且在访问时懈怠这个信息...原创 2020-02-06 17:24:09 · 375 阅读 · 0 评论 -
初探python爬虫(二)——POST请求
import requestsimport json#定义请求的urlurl = 'https://fanyi.baidu.com/sug'#定义请求头信息headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chro...原创 2020-02-06 16:10:00 · 294 阅读 · 0 评论 -
初探python爬虫(一)-get请求
爬虫步骤确定需求寻找需求发送请求解析数据存储数据请求方式:GET和POSTGET是默认的HTTP请求方式,用于直接输入网址的方式去访问网页POST方法主要是像Web服务器提交表单数据,通常扁担提交时采用POST方法GET把请求参数包含在url中,POST通过请求体传递参数GET相对POST不安全,参数直接暴露在url上,不用来传递敏感信息requests安装:pip...原创 2020-02-06 16:07:46 · 298 阅读 · 0 评论