beaurifulsoup读取本地网页数据并存入csv

毕业穷狗采用了paperYY查重,查重内容是以html显示,为了方便修改论文里面重复的地方,只能先把网页内容爬出来,然后再说。
直接上代码

from bs4 import BeautifulSoup
import csv
#读取本地网页
with open('C:/Dsoftdisk/python/paper check/allreport.html', 'r',encoding='utf8')as wb_data:
    Soup = BeautifulSoup(wb_data, 'lxml')
    with open('report.csv', 'a', newline='', encoding='gb18030')as f:#写入csv 文件中
        # content = Soup.find("div", class_="Origin_text").text()   #错
        # print(content)
        write = csv.writer(f)
        i=0
        for k in Soup.find_all('td', class_='Origin_text'):     #不能选class=summary,离得太远 #指定标签
            i+=1
            ori_text=k.find('em', class_='similar').get_text()  #指定文本  与上者结合,能提取所有指定文本
            print(i)
            print(ori_text)
            write.writerow([ori_text])
    f.close()

结果展示:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python是一种强大的编程语言,可以轻松地处理csv格式的数据读取csv一列数据存入数组是一个非常常见的操作,下面将介绍如何使用Python代码实现。 首先,我们需要导入Python中的csv模块,该模块提供了可以用来读取和写入csv文件的方法。 ```python import csv ``` 接着,我们需要使用open()函数打开要读取csv文件,并将其分配给一个变量。在打开文件时,我们可以指定文件的路径,也可以让Python在当前目录下查找文件。 ```python with open('example.csv') as csvfile: ``` 接下来,我们需要使用csv.reader()方法读取csv文件中每一行的数据。 ```python csvreader = csv.reader(csvfile) for row in csvreader: ``` 在每一行数据中,我们可以通过索引获取特定列的数据,例如第一列数据可以通过row[0]来获取。将每一行中指定列的数据存入数组中,可以使用Python中的append()方法。 完整的代码如下: ```python import csv data = [] with open('example.csv') as csvfile: csvreader = csv.reader(csvfile) for row in csvreader: data.append(row[0]) print(data) ``` 通过上述代码,我们可以读取一个csv文件中的第一列数据,并将其存入一个名为data的数组中。最后通过调用print()方法,将data数组中的所有数据输出到控制台。 总之,使用Python读取csv文件并将其存入数组中非常简单,只需要几个简单的步骤即可实现。在实际操作中,我们只需要根据需要进行一些微调和修改,以实现更加复杂的操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值