自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 力扣打卡7.13~8.04

给定两个数组,编写一个函数来计算它们的交集。.示例 1: 输入:nums1 = [1,2,2,1], nums2 = [2,2] 输出:[2,2] 示例 2: 输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4] 输出:[4,9]本人采用了最暴力但也是最好想的懒人方法:遍历短列表,如果长列表中存在就删除,然后将相同的添加到公共列表。方法比较耗时,属于偷懒行为,所以看了别人的方法。本人方法:class Solution: def intersect(self,.

2020-07-14 00:47:44 310

原创 python拼接json字典的键值对,无需遍历一次实现无序更新和插入mysql

解析json数据,根据接口返回的json字典无序更新mysql数据库表sql问题难点:数据库表的字段多,且顺序和json的字典里面键的顺序不一样,又不想遍历字典再去逐个更新数据库的字段。可以采用如下:sql = “update {} set " .format(“t_basic”) + “,”.join([’%s=%r’ % (k, basic[k]) for k in basic.keys...

2019-10-22 09:59:33 1211

原创 scrapy框架爬虫新闻网站步骤

First(准备工作):装好conda、python、pycharm环境下,命令行键入scrapy startproject 爬虫项目名(一般是域名+Spider就可以了 如BaiduSpider),之后键入cd 爬虫项目名 进入该路径下,再键入scrapy genspider 爬虫名(自己起一个比如baidu_spider) 域名(如baidu.com)Second(开始干啦)打...

2019-07-11 15:51:01 379

原创 pip3无法安装virtualenv

pip3报错安装python3.7.0后发现使用pip会出现如下报错:[root@localhost ~]# /usr/local/python3/bin/pip3 install virtualenvpip is configured with locations that require TLS/SSL, however the ssl module in Python is not available.Collecting virtualenv Retrying (Retry(total=

2020-10-10 16:39:59 1024

原创 杨子爽得剑指OF python版

1、在一个 n * m的二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。示例:现有矩阵 matrix 如下:[ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6, 9, 16,22], [10, 13, 14, 17, 24], [18, 21, 23, 26, 30] ] 给定 target = 5,返回

2020-08-15 18:11:50 230

原创 力扣打卡2

2020 08/05给你 n 个非负整数 a1,a2,…,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器,且 n 的值至少为 2。 图中垂直线代表输入数组[1,8,6,2,5,4,8,3,7]。在此情况下,容器能够容纳水(表示为蓝色部分)的最大值为 49。 示例:输入:[1,8,6,2,5,4,8,3,7] 输出:49

2020-08-06 00:10:44 237

原创 异常大全

异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivision

2020-07-25 20:38:34 355

转载 oracle安装的问题

[INS-30131]执行安装程序验证所需的初始设置失败(无法访问临时位置)解决方法!安装oracle11g或12C碰到“无法访问临时位置”的问题,详细信息如下:[INS-30131]执行安装程序验证所需的初始设置失败(原因:无法访问临时位置)操作 - 请确保当前用户具有访问临时位置所需的权限。解决方案1:(验证未解决)C:\Users\Administrator>net share C=C:C=C:C=C:C 共享成功。C:\Users\Administrator>net use

2020-06-22 15:52:14 171

原创 《中文事件抽取关键技术研究》论文赏析

摘要部分本文主要研究中文事件抽取技术,这其中主要包括三个方面:1、时间表达式识别提出一种基于词典特征优化和依存关系的中文时间表达式识别方法。2、事件检测与分类提出了一种基于依存句法分析与分类器融合的事件触发词抽取方法。3、事件论元角色抽取针对传统基于机器学习的方法通常将句法分析信息转化为平面特征,并不能全面利用句法分析信息的问题,提出了一种基于卷积树核的事件论元角色抽取方法。我...

2020-03-09 12:46:06 1500

转载 依存语法的基本术语

转载:https://www.cnblogs.com/sherry-yang/p/9061341.html计算机语言学家罗宾森总结了依存语法的四条定理**1、一个句子中存在一个成分称之为根(root),这个成分不依赖于其它成分。2、其它成分直接依存于某一成分;3、任何一个成分都不能依存与两个或两个以上的成分;4、如果A成分直接依存于B成分,而C成分在句中位于A和B之间,那么C或者直接依存...

2020-02-26 15:16:23 2409 1

转载 BERT

转:https://www.cnblogs.com/rucwxb/p/10277217.html【NLP】彻底搞懂BERT自google在2018年10月底公布BERT在11项nlp任务中的卓越表现后,BERT(Bidirectional Encoder Representation from Transformers)就成为NLP领域大火、整个ML界略有耳闻的模型,网上相关介绍也很多,但很多...

2020-02-21 17:35:48 256

原创 用python查询数据库,返回字段名和值组成的字典类型

def Selectt_baisic ():db = pymysql.connect(“10.***.***.***”, “root”, “123456”, “my_db”, port=3310, charset=‘utf8’, cursorclass=pymysql.cursors.DictCursor)cur = db.cursor()sql = “Select * from t_bas...

2019-10-22 11:12:14 3906

原创 关于爬虫图片

我不知道哪些图片的格式可以通过urllib.request.urlretrieve(item[‘pic’], picpath)来抓取,但是,.svg这种比较流行的图片格式肯定是不行的,另外,那些虽然可以在网址上访问的但是没有http协议的也是爬不下来的,比如://cdn.cnn.com/cnnnext/dam/assets/150406204033-lgct-venue-on-miami...

2019-08-14 18:10:46 177

原创 关于列表嵌套字典转json存mysql问题

coding: utf-8list1 = list(range(len(d)))for p in d:# print(p[1], p[2], p[3])list1[paranum] = {“ParaId”: p[1], “Sentence”: p[2], “Sentence_cn”: p[3]}paranum += 1 data = [json.dumps(w, ensure_a...

2019-07-23 15:13:35 916

原创 C#处理字符串分段,还是要从爬虫代码下手

C#处理字符串分段C#制作窗体时,如果数据库内的新闻内容是一整个混杂的字符串,当放到软件窗体里面不好展示成段落格式时,通过修改爬虫:用xpath捕捉文本内容时,通过extract()提取的文本(原网站上的新闻本来就是一段一段的),此时是一个字符串列表,通过 ‘’.join()实现将所有段落连成一整个字符串,段落连接的标志位就是上面的文本()。再将这样的一整个字符串存到数据库中去。在制作窗...

2019-07-18 16:07:52 352

原创 下载新闻图片到本地文件夹

import osimport pathlibimport urllibimport urllib.request if item['pic'] != "无图片": file_name = str(newsID) fname = time.strftime("%Y%m%d", time.localtime()) ...

2019-07-09 11:12:53 261

转载 Python time strftime()方法

描述Python time strftime() 函数接收以时间元组,并返回以可读字符串表示的当地时间,格式由参数format决定。语法strftime()方法语法:time.strftime(format[, t])参数format – 格式字符串。t – 可选的参数t是一个struct_time对象。返回值返回以可读字符串表示的当地时间。说明python中时间日期格式化符...

2019-07-08 13:43:30 914

转载 Python类中的self到底是干啥的

Python类中的self到底是干啥的Python编写类的时候,每个函数参数第一个参数都是self,一开始我不管它到底是干嘛的,只知道必须要写上。后来对Python渐渐熟悉了一点,再回头看self的概念,似乎有点弄明白了。首先明确的是self只有在类的方法中才会有,独立的函数或方法是不必带有self的。self在定义类的方法时是必须有的,虽然在调用时不必传入相应的参数。self名称不是必须的...

2019-07-05 15:51:32 294

转载 Python 转义字符

转义字符 描述(在行尾时) 续行符\ 反斜杠符号’ 单引号" 双引号\a 响铃\b 退格(Backspace)\e 转义\000 空\n 换行\v 纵向制表符\t 横向制表符\r 回车\f 换页\oyy 八进制数,yy代表的字符,例如:\o12代表换行\xyy 十六进制数,yy代表的字符,例如:\x0a代表换行\other 其它的字符以普通格式输出...

2019-07-05 14:30:34 141

原创 爬校花网保存图片到本地文件夹

import reimport requestsurl=‘http://www.xiaohuar.com/2014.html’wb_data=requests.get(url).textprint(wb_data)res=re.compile(r’src="(.*?.jpg)"’)items=re.findall(res,wb_data)print(items)num=0for ...

2019-07-04 14:58:42 291

转载 为什么要使用JSON?

为什么要使用JSON?什么是JSON ?JSON的优点比较XMLXML 和 JSON 代码比较JSON支持的数据类型四种基础类型两种结构类型JSONArray类型JSON的使用JavasScript 使用JS使用演示JAVA使用总结为什么要使用JSON?在微服务数据传输时,被要求使用JSON进行传输,想写一篇关于JSON的博客。什么是JSON ?百度百科JSON...

2019-07-04 10:57:37 5161

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除