Python
文章平均质量分 94
啃西瓜的小煤球
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python实现DBSCAN聚类
该博客配套代码、数据及PPT见百度网盘链接:https://pan.baidu.com/s/1j1iWnhXmQiAnQ7VnfsCIrQ提取码:6666算法实战数据为31个省份的出生率和死亡率,文件名为Province.xlsx在密度聚类算法的实战部分,我们将使用国内31个省份的人口出生率和死亡率数据作为分析对象。首先,将数据读入到Python中,并绘制出生率和死亡率数据的散点图,代码如下:import pandas as pdimport matplotlib.pyplo.原创 2022-04-25 12:23:52 · 10313 阅读 · 0 评论 -
函数基础
print(abs(-8))"""数据类型不对print(asfadsf)数据类型不对abs('asbfiu')参数个数不符合abs(2,1,4)"""#定义函数的格式# def 函数名():# passdef my_abs(n): print(-n)my_abs(-8)def select_stu(): print('--------...原创 2019-09-17 09:31:45 · 359 阅读 · 0 评论 -
xpath和爬虫基础
from lxml import etreeroot1 = '''<div> <ul> <li class="item-0"> <a href="link1.html">first item</a> </li> <li cla...原创 2019-09-17 09:33:41 · 358 阅读 · 0 评论 -
爬取图片2.0
#删除指定路径下 后缀为.jpg的文件import osdir_list = os.listdir("C:/Users/Administrator/Desktop/python实训/venv")print(dir_list)for dir in dir_list: if dir.endswith('.jpg'): os.remove(dir)"""1.使用r...原创 2019-09-17 16:22:25 · 845 阅读 · 0 评论 -
爬取豆瓣电影Top250
"""总结爬虫中遇到的问题。"""import requestsfrom lxml import etreefor page in range(0,10): page = page*25 url = 'https://movie.douban.com/top250?start=%s&filter='%page #请求目标url respons...原创 2019-09-18 11:29:19 · 1438 阅读 · 0 评论 -
爬取图片3.0
import requests,osfrom lxml import etreeurl = 'https://www.ivsky.com/tupian/ziranfengguang/'response = requests.get(url)root = etree.HTML(response.content)#目标内容;每个大分类的链接。urlbig_cate_list = roo...原创 2019-09-18 11:30:29 · 361 阅读 · 0 评论 -
爬取前程无忧网
这种写法会报错误"""目标内容:职位名称--公司名称--地点--薪资--发布时间内容处理:地点只要市,不要区薪资转成数字类型"""import requests,re,timefrom lxml import etreefor page in range(1,101): url = 'https://search.51job.com/list/01000...原创 2019-09-19 10:57:16 · 1726 阅读 · 0 评论 -
爬取起点中文网
import requestsfrom lxml import etreefor page in range(1,15): url = 'https://www.qidian.com/all?orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=0&page=%s'%pa...原创 2019-09-19 17:15:00 · 3693 阅读 · 0 评论 -
反反爬虫
有时候会遇到网站封锁IP的情况,这时候我们可以更改请求头和IP地址来反反爬虫#使用随机请求头+代理IP访问网页#post():携带参数向网页发起请求#付费的花生代理user_agent_list = [ "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, li...原创 2019-09-19 17:20:01 · 581 阅读 · 0 评论 -
爬取智联招聘
import requests,json,reurl = 'https://fe-api.zhaopin.com/c/i/sou?pageSize=90&cityId=530&salary=0,0&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelf...原创 2019-09-20 11:30:13 · 884 阅读 · 0 评论 -
实现学员管理系统
"""班级学员管理系统需求:简单的设计一下首页。1、添加学员信息,设计简单的页面2、删除学员信息,学员信息为空则不执行操作3、修改学员信息,学员信息为空不执行操作(当修改的学员的姓名不在列表中时返回错误)4、查找学员信息,把学员信息,依次输出在终端页面"""Student_List = []while True: print(' ') print('--...原创 2019-09-12 12:25:40 · 1472 阅读 · 0 评论 -
索引取出list中的指定元素
"""请用索引取出下面的list的指定的元素:取出Apple,bart,ruby"""L = [ ['Apple','Google','Microsoft'], ['Java','Python','Ruby','PHP'], ['Adam','Bart','Lisa']]#第一种写法L1 = L[0]print(L1[0])#第二种写法print(L[...原创 2019-09-12 11:50:16 · 4113 阅读 · 0 评论 -
if语句
# if判断语句# 判断条件结果是一个布尔值 True False# 格式1:判断一个人的年龄是否大于18岁# 如果成年允许喝酒 一般只考虑一种情况age = input("你今年多大了?:")age = int(age)if age >= 18: print("你可以喝了")# 格式2:用来判断两种情况 注意else后面有冒号 if 条件后面也要有冒号#字符串不...原创 2019-09-10 10:54:55 · 960 阅读 · 0 评论 -
二维码 安装第三方库 画图
#将C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Scripts#添加到环境变量 在cmd中用pip list 检查是否添加成功#然后pip install myqr 下载第三方库#terminal中输入指令跟cmd中输入等价from MyQR import myqrmyqr.run( words...原创 2019-09-10 16:57:51 · 381 阅读 · 0 评论 -
for 循环 猜数字 绘图2 皮卡丘
#100以内既是5的倍数又是2的倍数的和count = 0for a in range(1001): if a % 5 == 0 and a % 2 ==0: count = count + aprint(count)"""猜数字游戏1.100以内(包括100)2.最多比赛三次3.谁先胜利两次就输出**胜利 不在进行第三次比赛4.若三次都比完没人胜利出...原创 2019-09-11 10:42:43 · 575 阅读 · 1 评论 -
while循环
x=0while True: x += 1 print(x) if x == 100000: break"""for循环和while循环的关系1.for循环注重次数 while循环注重条件2.for循环能做的while循环都能做 while循环能做的for循环不一定能做3.但是for循环 用的更多"""import turtlepen ...原创 2019-09-11 17:38:09 · 530 阅读 · 0 评论 -
常用的占位符
# 常用的占位符:一般对字符串使用的# %s:几乎可以表示任意类型的变量x = input('请问你叫什么名字?:')# y = 'It工程师'name = '我叫%s,我是中国人'%xprint(name)# %d用于表示整数age = int(input('你多大了'))info = '我的年龄是%d岁'%ageprint(info)# 生成往前100页的url地址规...原创 2019-09-11 17:39:18 · 4677 阅读 · 0 评论 -
画出自己的名字
import turtleturtle.hideturtle()turtle.speed(1)turtle.right(45)turtle.fd(10)turtle.up()turtle.seth(215)turtle.fd(15)turtle.down()turtle.seth(1)turtle.fd(30)turtle.up()turtle.seth(230)tu...原创 2019-09-11 17:41:35 · 2473 阅读 · 0 评论 -
运算符
"""#运算符print(16%3)print(2**3)#2的三次方print(16//3)#取接近于整除的数#字符串的位置a = 'Hello'#字符串的每一个字或字母都有自己的位置,这个位置叫做索引值print(a[0])#索引超出范围 IndexError: string index out of rangeinfo = '今天星期三,明天上完课就放假了'prin...原创 2019-09-11 18:01:52 · 618 阅读 · 0 评论 -
os库的使用
import os#getcwd():得到当前工作目录print(os.getcwd())#listdir:返回指定目录下的全部文件和文件夹print(os.listdir('C:/Users/Administrator/Desktop'))#创建文件夹 mkdiros.mkdir('python新建的文件夹')for a in range(10): os.mkdi...原创 2019-09-12 11:31:06 · 406 阅读 · 0 评论 -
列表基本操作
#列表:['',2]#列表可以添加任何数据类型,也可以存放列表.但是我们推荐添加同一种类型.#可以对列表里面的数据进行操作.向列表里添加数据.删除数据.修改数据.查找数据#创建列表list1 = ['张三','李四','王五']#创建空列表list2 = []#添加数据 append方法会把元素默认添加到列表的末尾list2.append(89)print(list2)...原创 2019-09-12 11:35:32 · 613 阅读 · 0 评论 -
字典的基本操作
#字典:是以键值对的方式存储数据.#他和列表都是可变容器模型.也是存放任意数据类型的#字典里面的键不可以重复.具有唯一性#字典的格式:每个键值对中(key:value)用:分割 每组数据之间用逗号分割 整个字典都在一个{}里#创建一个字典dict1 = {'a':1,'b':2,'c':3}#创建一个空字典dict2 = {}#对数据的操作方法比较单一:都是根据key来...原创 2019-09-12 11:44:24 · 630 阅读 · 0 评论 -
print语句 基本数据结构
print("hello world!", '计算机与信息技术', '305教室')# 这是第一个注释 字符串是一种数据类型 由单引号 双引号 三引号构成。# 常用的编码格式:utf-8# 中文编码格式: gbk gb 18030# name 在这里是变量名name = input('你渴望力量吗?')print(name)# 创建变量使用 变量名=具体的值 变量可以是一切东西...原创 2019-09-10 08:34:59 · 1002 阅读 · 0 评论
分享