新开课day20总结

selenium

在进行selenium爬取之前需要有一些准备工作,即装selenium包和下载chomedriver

  1. 这里为主要写命令装指定版本的selenium包,在terminal中如下操作:

在这里插入图片描述

  1. 下载chomedriver

(1)先获取当前谷歌浏览器版本信息,在谷歌浏览器中输入链接:chrome://version/

(2)chromedriver下载地址:http://chromedriver.storage.googleapis.com/index.html

(3)找到和当前谷歌版本对应的chromedriver,如果没有,则找和谷歌版本最近的chromedriver

(4)下载后解压,将解压文件内容放入python的安装地址中,到此chomedriver操作结束

使用selenium爬取数据

1创建浏览器获取原代码

from selenium.webdriver import Chrome
a = Chrome()
a.get('https://www.hao123.com/?tn=48021271_45_hao_pg')

2获取网页源代码

print(a.page_source)

3关闭浏览器

a.close()

csv文件

1.什么是csv文件,逗号分割文件

定义:一种后缀是.csv的文件,文件中的每一行通过逗号分割成不同的类,csv可以用exceL软件像打开excel文件-样去打开。

csv文件的读

reader获取文件内容,将每一-行内容作为一 个迭代器中的元素返回

import csv
f = open('电影.csv','r',encoding='utf-8',newline='')
f_reader = csv.reader(f)
for item in f_reader:
    print(item)

DictReader获取文件内容,

import csv
f = open('电影.csv','r',encoding='utf-8',newline='')
f1 = csv.DictReader(f)
for it in f1:
    print(it)

csv文件的读

csv.writer:

f2 = open('test.csv','w',encoding='utf-8',newline='')
x = [
    ['张三','男','004','78','四川'],
    ['李四','男','009','87','贵州'],
    ['王五','男','002','89','美国'],
    ['赵六','男','089','90','沈阳']
]
f2_write = csv.writer(f2)
f2_write.writerows(x)

csv.DictWriter:

f2 = open('test.csv','w',encoding='utf-8',newline='')
f2_write = csv.DictWriter(f2,['姓名','性别','学号','籍贯'])
f2_write.writeheader()#加上这句话才有第一行
f2_write.writerow({'姓名':'赵六','性别':'男','学号':'089','籍贯':'沈阳'})
f2_write.writerow({'姓名':'赵1六','性别':'男','学号':'059','籍贯':'沈阳'})
f2_write.writerow({'姓名':'赵2六','性别':'男','学号':'039','籍贯':'沈阳'})
f2.close()
:'059','籍贯':'沈阳'})
f2_write.writerow({'姓名':'赵2六','性别':'男','学号':'039','籍贯':'沈阳'})
f2.close()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值