自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 sapCy简介

作者:明天依旧可好 | 柯尊柏 邮箱:ke.zb@qq.com 一、spaCy简介 spaCy 是一个是具有工业级强度的Python NLP工具包,完成了NLP领域的很多任务比如词性标注,命名实体识别,依存句法分析,归一化,停用词等等,支持Unix/Linux,macOS/os X和Window...

2020-03-01 17:35:53 170 0

原创 neuralcoref使用教程-指代消解
原力计划

作者:明天依旧可好 | 柯尊柏 联系方式:ke.zb@qq.com 创作时间:2020.3.1 neuralcoref与spaCy的配合使用目前版本上bug(今天是2020.3.1),需要将spaCy降解到2.1.0版本才可以正常使用 pip install spaCy==2.1.0 如果事前...

2020-03-01 12:40:16 369 6

原创 selenium教程

环境: Python3.6.5 编译器: Sublime Text 3 代码: GitHub 联系方式: ke.zb@qq.com 第三方库: selenium 文章目录一、简介二、安装三、 一、简介 我们模拟登陆用的是selenium库,selenium是一个自动化测试工具,在爬虫中通常用来进...

2019-01-22 16:22:09 2249 4

原创 pandas库简单入门

文章目录1 利用pandas包读取CSV文件2 利用pandas包写CSV文件3 修改DataFrame中的某一元素4 删除DataFrame中某一行5 遍历DataFrame数据类型6 合并DataFrame数据类型6.1 相同字段的表首尾相接6.2 横向表拼接(行对齐)7 查找DataFram...

2018-12-03 10:53:59 28760 0

原创 实战项目二:实现CSDN自动点赞

环境: Python3.6.5 编译器: Sublime Text 3 代码: GitHub 联系方式: ke.zb@qq.com 第三方库: selenium 写在前面:本文仅供参考学习,请勿用作它途。 文章目录一、思路二、代码实现(一)导入第三方库(二)登录账号(三)保存cookies到文件...

2018-11-04 17:15:38 21797 4

原创 机器学习第8天:IPyhon与Jupyter notebook

文章目录一、IPython是什么二、IPython的安装三、IPython功能介绍(一)用符号?获取文档 一、IPython是什么 ipython是一个python的交互式shell,比默认的python shell好用得多,支持变量自动补全,自动缩进,支持bash shell命令,内置了许多...

2018-10-15 16:47:28 30247 3

原创 实战项目三:爬取QQ群中的人员信息

文章目录一、selenium简介(一)实例说明(二)元素定位方式(三)实现滚动条自动下拉二、Xpath简介三、模拟登陆 一、selenium简介 我们模拟登陆用的是selenium库,selenium是一个自动化测试工具,在爬虫中通常用来进行模拟登陆。 (一)实例说明 from selenium ...

2018-10-12 22:24:55 23249 0

原创 机器学习第5天:逻辑回归

文章目录一、环境二、具体实现步骤第1步:数据预处理导入库导入数据将数据集分成训练集和测试集第2步:逻辑回归模型第3步:预测结果第4步:评估预测结果生成混淆矩阵混淆矩阵可视化三、可视化结果展示四、逻辑回归是什么五、知识点详解1. 关于可视化 一、环境 Python3.6.5 编译器:jup...

2018-09-25 13:40:01 31618 3

原创 机器学习第3天:多元线性回归

文章目录一、具体实现步骤第1步:数据预处理导入库导入数据集将类别数据数字化躲避虚拟变量陷阱拆分数据集为训练集和测试集第2步: 在训练集上训练多元线性回归模型第3步:在测试集上预测结果第4步:数据可视化二、知识点详解1. 关于多元线性回归 一、具体实现步骤 第1步:数据预处理 导入库 import ...

2018-09-21 08:10:19 25783 2

原创 机器学习第1天:数据预处理

文章目录一、预备知识二、具体实现步骤第1步:导入库第2步:导入数据集第3步:处理丢失数据第4步:解析分类数据创建虚拟变量第5步:拆分数据集为训练集合和测试集合第6步:特征标准化三、知识点详解1. Imputer处理缺损数据2. 关于fit()、transform()、fit_transform()...

2018-09-18 21:52:19 25880 7

原创 知识点讲解五:处理js异步加载问题

前言 在新闻网站中大多采用的是异步加载模式,新闻条目会随滚动条的滚动而逐渐加载。当爬虫访问这类网站时得到的HTML数据仅仅是我们看到的页面数据,只有当我们向下滚动时,网页的源代码才会同步更新。例如:腾讯新闻,处理这类JS异步加载的问题,这里用selenium来解决。 环境 Python 3.6....

2018-09-17 21:55:06 21860 4

原创 知识点讲解二:关于requests里的timeout()

超时(timeout) 为防止服务器不能及时响应,大部分发至外部服务器的请求都应该带着 timeout 参数。在默认情况下,除非显式指定了 timeout 值,requests 是不会自动进行超时处理的。如果没有 timeout,你的代码可能会挂起若干分钟甚至更长时间。 ...

2018-08-18 22:29:18 42821 12

原创 Python学习之GUI--登录系统界面篇

导言篇: 我的python环境是:python3.6.5 这里我选择的GUI编程包是:tkinter tkinker在python2.5以后就是自带包了,所以我们不需要另外安装 tkinker相对与其他python GUI编程的包而已,是相对容易入手的 代码篇: #这是系统的登录...

2018-06-12 21:11:25 45495 32

原创 一行代码制作你的专属动态二维码-Python实现

作者:明天依旧可好 创作时间:2020.06.28 微信:mtyjkh_ 看下我们原始的二维码是啥样的 我们的动图是啥样的 升级一下二维码 开始工作 首先安装myqr pip install myqr 再看一下我们是原始二维码 from MyQR import myqr myqr.ru...

2020-06-28 10:40:32 44 0

原创 四连环游戏-Python实现

题目: 用Python实现四连环游戏 四连环是一个双人游戏,两位玩家轮流将自己的棋子放在一个8列6行的筒状棋盘上。游戏的目标是在对手之前将自己的4个相邻棋子放在一行、一列或一条斜线上。 程序扮演一位玩家(劳拉),用户作为其对手。程序采用随机方式选择要放棋子的列,用户则是手工输入要放棋子的列。 假...

2020-06-27 09:26:44 71 0

原创 LeetCode题组:第322题-零钱兑换

1.题目 难度:中 给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,返回 -1。 示例 1: 输入: coins = [1, 2, 5], amount = 11 输出: 3 解释: 11 =...

2020-04-10 16:47:31 59 0

原创 LeetCode题组:第836题-矩形叠加

1.题目 难度:简单 矩形以列表 [x1, y1, x2, y2] 的形式表示,其中 (x1, y1) 为左下角的坐标,(x2, y2) 是右上角的坐标。如果相交的面积为正,则称两矩形重叠。需要明确的是,只在角或边接触的两个矩形不构成重叠。给出两个矩形,判断它们是否重叠并返回结果。 示例 1: ...

2020-04-09 21:01:53 42 0

原创 LeetCode题组:第543题-二叉树的直径

1.题目 给定一棵二叉树,你需要计算它的直径长度。一棵二叉树的直径长度是任意两个结点路径长度中的最大值。这条路径可能穿过也可能不穿过根结点。 示例 : 给定二叉树 1 / \ 2 3 / \ 4 5 返回 3, 它的长度是路...

2020-04-09 17:09:05 55 0

原创 LeetCode题组:第206题-反转链表

1.题目 难度:简单 反转一个单链表。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->NULL 2.我的解答 /** * Definition for singly-linked l...

2020-04-09 16:41:27 48 0

原创 LeetCode题组:第169题-多数元素

1.题目 难度:简单 给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示例 1: 输入: [3,2,3] 输出: 3 示例 2: 输入: [2,2,1,1,1,2,2] 输出:...

2020-04-09 15:50:25 38 0

原创 LeetCode题组:第121题-买卖股票的最佳时机

1.题目 给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。 如果你最多只允许完成一笔交易(即买入和卖出一支股票一次),设计一个算法来计算你所能获取的最大利润。 注意:你不能在买入股票前卖出股票。 示例 1: 输入: [7,1,5,3,6,4] 输出: 5 解释: 在第 2 ...

2020-04-08 11:06:46 36 0

原创 LeetCode题组:第26题-删除排序数组中的重复项

1.题目:删除排序数组中的重复项 给定一个排序数组,你需要在 原地 删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。(注意这里提到了排序数组,也就是说数组是有序的。如果无序,我们又该如何解决这个问题呢,我下面给出了无序数组的解决方案,当然也适用于有序数组) 不要使用额外的数组空...

2020-04-08 10:27:39 27 0

原创 C语言结构体指针

先观察语句1与语句2的区别 struct ListNode{ int val; struct ListNode *next; }; struct ListNode* temp; //1 struct ListNode header; //2 语句1中的temp是一个指针,指向某...

2020-04-07 13:07:38 37 0

原创 LeetCode题组:第21题-合并两个有序链表

1.题目:合并两个有序链表 将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例: 输入:1->2->4, 1->3->4 输出:1->1->2->3->4->4 2.我的解答 struct ...

2020-04-07 12:52:42 110 0

原创 LeetCode题组:第20题-有效的括号

1.题目:回文数 给定一个只包括'(',')','{','}','[',']' 的字符串,判断字符串是否有效。 有效字符串需满足: 1.左括号必须用相同类型的右括号闭合。 2....

2020-04-06 20:14:26 51 0

原创 LeetCode题组:第14题-最长公共前缀

1.题目:最长公共前缀 编写一个函数来查找字符串数组中的最长公共前缀,如果不存在公共前缀,返回空字符串 ""。 示例 1: 输入: [“flower”,“flow”,“flight”] 输出: “fl” 示例 2: 输入: [“dog”,“racecar”,“car”] ...

2020-04-06 18:43:21 50 0

原创 C语言-求字符串长度-strlen()与sizeof()

需要在代码头部加上标准库<string.h> 代码示例 #include <string.h> char s1[20] = "hello world"; char s2[20] = {'h','e','...

2020-04-06 09:53:19 41 0

原创 LeetCode题组:第13题-罗马数字转整数

1.题目:回文数 罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000 例如, 罗马数字 2 写做II ,即为两个并列的 1。12写做 XII ,即为 X...

2020-04-06 09:40:33 44 0

原创 C语言-将数字转化为字符串

函数名 作 用 itoa() 将整型值转换为字符串 itoa() 将长整型值转换为字符串 ultoa() 将无符号长整型值转换为字符串

2020-04-05 16:35:03 33 0

原创 LeetCode题组:第9题-回文数

1.题目:回文数 判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。 示例 1: 输入: 121 输出: true 示例 2: 输入: -121 输出: false 解释: 从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文...

2020-04-05 16:30:57 28 0

原创 LeetCode题组:第7题-整数反转

题目:整数反转 给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。 示例 1: 输入: 123 输出: 321 示例 2: 输入: -123 输出: -321 示例 3: 输入: 120 输出: 21 注意: 假设我们的环境只能存储得下 32 位的有符号整数,则其...

2020-03-31 11:18:25 37 0

原创 LeetCode题组:第1162题-地图分析

题目:地图分析 你现在手里有一份大小为 N x N 的『地图』(网格) grid,上面的每个『区域』(单元格)都用 0和 1标记好了。其中 0 代表海洋,1 代表陆地,你知道距离陆地区域最远的海洋区域是是哪一个吗?请返回该海洋区域到离它最近的陆地区域的距离。 我们这里说的距离是『曼哈顿距离』( M...

2020-03-29 12:07:58 69 0

原创 LeetCode题组:第914题-卡牌分组

题目:卡牌分组 给定一副牌,每张牌上都写着一个整数。 此时,你需要选定一个数字 X,使我们可以将整副牌按下述规则分成 1 组或更多组: 每组都有 X 张牌。 组内所有的牌上都写着相同的整数。 仅当你可选的 X >= 2 时返回 true。 示例 1: 输入:[1,2,3,4,4,3,2,1...

2020-03-27 20:11:58 45 0

原创 memset()函数介绍

函数原型为: void * memset( void * ptr, int value, size_t num ); 参数说明: ptr :为要操作的内存的指针。 value: 为要设置的值。你既可以向 value 传递 int 类型的值,也可以传递 char 类型的值,int 和 char ...

2020-03-17 13:33:27 43 0

转载 TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range的意义

tfidf = TfidfVectorizer(stop_words='english',ngram_range=(1,1)) 中ngram_range(min,max)是指将text分成min,min+1,min+2,…max 个不同的词组 比如’Python is use...

2020-03-02 16:54:19 309 0

翻译 spaCy教程(翻译自官网)

译者: 明天依旧可好 | 柯尊柏 联系方式: ke.zb@qq.com 翻译时间: 2020.2.26 原文链接:spaCy 101: Everything you need to know 说明: 本文绝大部分会按照官网进行翻译,同时也加入部分自己的语言以便大家更好的理解。 例1: “Som...

2020-02-26 15:19:56 218 0

原创 Matplotlib可视化系列教程-说明兼目录

1.花最少的时间学习最有用的知识,将时间花在刀刃上。 一、Matplotlib-scatter-绘制散点图 二、Matplotlib-hist-直方图(条形统计图) 这篇文章会随着时间不断更新 ...

2020-01-06 13:52:55 91 0

原创 Matplotlib-hist-直方图(条形统计图)

前言 直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。 直方图是数值数据分布的精确图形表示。 这是一个连续变量(定量变量)的概率分布的估计,并且被卡尔·皮尔逊(Karl Pearson)...

2020-01-05 14:17:34 411 0

原创 Matplotlib-scatter-绘制散点图

一、简单图像 1.代码 import numpy as np import matplotlib.pyplot as plt #生成散点数据 n = 1024 X = np.random.normal(0,1,n) Y = np.random.normal(0,1,n) plt.scatter...

2019-12-31 11:18:57 302 0

原创 数据分析系列:绘制折线图(matplotlib)2

作者:明天依旧可好 | 柯尊柏 工具:Jupyter notebook 环境:Python 3.6.5 与上一份代码相比我们仅仅是去掉了plt.plot()中参数x。 import matplotlib.pyplot as plt import numpy as np n = ["h...

2019-07-16 22:27:40 219 0

提示
确定要删除当前文章?
取消 删除