自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 python爬虫智能解析之newspaper

最近抓取了某查新闻舆情维度的数据,业务需求做一个情感分析,需要抓取相关链接的正文(因某查抓下来的只有摘要),新闻舆情的链接已经抓下来了,但是如下图所示这么多网站:我总不能每个网站写一个爬虫抓正文吧,那不得累死!于是想起来之前听过的智能化解析,遂学习一番,现需求任务已完成,在此做个记录总结与分享.newspaper库分为Python2和Python3两个版本,Python2下的版本叫做newspaper,Python3下的版本叫做newspaper3k,Python2版本的不做说明,下面使用Python3版本

2022-06-17 17:08:15 1515 1

转载 selenium.webdriver.support.ui 和selenium.webdriver.support.wait的区别

网上搜了很久,没有找到合适答案。我们知道,selenium.webdriver.support.ui 和selenium.webdriver.support.wait都是用来做显式等待的,但两者有什么区别呢?进入selenium的官方文档https://seleniumhq.github.io/selenium/docs/api/py/api.html可以发现,里面并没有出现selenium.webdriver.support.ui,所以判断是ui换成了wait,这样更直接易懂。也就是说二者没有区别!

2020-09-12 10:40:18 720

原创 deepin中typora无法设置为默认程序的解决办法

首先在终端运行sudo dedit /usr/share/applications/io.typora.desktop在exec一项的最后加上一个“ %F“再在末尾添加一行“MimeType=application/markdown.md;”然后保存即可,此时就可以从md文件的打开方式中看到typora了如下图所示:...

2020-07-02 19:14:23 961 3

原创 Markdown常用快捷键及编辑器推荐

快捷键无序列表:输入-之后输入空格有序列表:输入数字+“.”之后输入空格任务列表:-[空格]空格 文字标题:ctrl+数字表格:ctrl+t生成目录:[TOC]按回车选中一整行:ctrl+l选中单词:ctrl+d选中相同格式的文字:ctrl+e跳转到文章开头:ctrl+home跳转到文章结尾:ctrl+end搜索:ctrl+f替换:ctrl+h引用:输入>之后输入空格代码块:ctrl+alt+f加粗:ctrl+b倾斜:ctrl+i下划线:ctrl+u删除线:alt

2020-06-20 11:28:51 353 1

原创 PyCharm常用快捷键

常用快捷键1、Ctrl + D:向下复制当前行2、Shift + Enter:  快速在当前行下创建一个空行3、Ctrl + /:注释(取消注释)选择的行;4、Ctrl + Alt + L:格式化代码(与QQ锁定热键冲突,关闭QQ的热键);5、Ctrl + Shift + +:展开所有的代码块;6、Ctrl + Shift + -:收缩所有的代码块;7、...

2020-06-20 10:54:11 651 1

原创 selenium中的常用命令/模块/参数总结

1.导入所需要的模块from selenium.webdriver.chrome.options import Optionsfrom selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions a

2020-06-20 10:40:14 1215

原创 Python操作Excel时的xlrd和xlwt

什么是xlrd模块和xlwd模块? ♦python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。1.python中的xlrd模块♦1.安装xlrd模块pip install xlrd♦2. 使用介绍常用单元格中的数据类型 - empty(空的)string(text)numberdatebooleanerrorblank(空白表格)导入模块 import xlrd打开Excel文件读取数据

2020-06-20 10:24:39 782 1

转载 redis复习

[原文链接:添加链接描述https://blog.csdn.net/xiaobai_mantou/article/details/106308330]1.概念​ redis是一款高性能的NOSQL系列的非关系型数据库1.1.什么是NOSQL NoSQL(NoSQL = Not Only SQL),意即“不仅仅是SQL”,是一项全新的数据库理念,泛指非关系型的数据库。 随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0

2020-06-08 14:13:05 145

原创 deepin-15.11系统安装Python3.7.4及idle

deepin-15.11系统安装Python3.7.4及idlesudo apt updatesudo apt install -y make build-essential libssl-dev zlib1g-devsudo apt install -y libbz2-dev libreadline-dev libsqlite3-dev wget curl llvmsudo...

2020-04-08 10:40:31 610

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除