自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 python读取、写入以及删除es数据

最近这段时间被es所困扰,庆幸最终学会了python读取、删除和存储es,怕以后忘记了,把代码放出来:

2022-03-30 17:31:30 6103

原创 xlwt与openpyxl的用法与区别

xlwt和openpyxl写入数据的方法和区别

2022-03-15 10:14:54 2087

原创 TypeError: string indices must be integers

在获取相应的内容后,内容的呈现方式为字典,但采用键的方式报错,在网上查了几种方法,都没有解决,后来发现r.json()这一用法,可以将获得内容转换为字典格式,之后再用键查找就不会报错了page = requests.get(url, headers=headers)data=page.json()['data']...

2022-03-14 15:07:15 772

原创 SQL语句查询重复语句并进行标记和更新

SELECT * from (select *,Row_Number() OVER(PARTITION BY "Full Journal Title" ORDER BY "Full Journal Title") as row_num --开窗函数对于重复数据进行排序from tmp_journal_if_from_sci_copy1) as foowhere foo.row_num>1 --筛选出重复数据使用开窗函数,可对重复的数据量进行排序,筛选出序列为2及以上的数据,即为重.

2022-02-18 14:00:33 2602

原创 使用xlwt库创建表格并存储数据

在存储数据时,可供使用的库较多,我常用的库是xlwt库,但每次用了一遍之后,下次再写比较麻烦,所以直接写成一段代码,如果以后有需要,可以直接复制粘贴再修改使用。import xlwtdef sav_xls(info): #info是传的参数,info是一个列表,存储着信息。 book=xlwt.Workbook() #创建excel表 sheet=book.add_sheet('sheet1') #创建工作表 title=['url','info'] #第一行的标题

2022-02-17 09:53:43 628

原创 爬虫和存储过程中遇到的问题

昨天写了个爬虫程序,中间遇到了各种可能遇到的问题,现在将问题写下来,希望以后不再2犯同样的错误。这一个代码块用于读取txt文件,并将其转换成列表,文件中存储的为url。但在实际转换为列表之后再输出,发现多了一个"\n",因此导致输出的url错误,对此,可在实际爬取url时候,将“\n”去掉。def read_txt(): f = open('url.txt') #打开存储的txt文件 url_list = list(f) #将文件转换成列表 # print(url_lis

2022-02-17 09:38:32 213

原创 xpath取空标签里面的内容

这几天爬虫遇到一个问题,有标签之间的内容为空,如下图:最后一个td标签是没有内容的,如果直接用xpathtiq

2022-02-15 09:25:23 1260 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除