喜欢Haibara
码龄8年
关注
提问 私信
  • 博客:95,973
    动态:13
    95,986
    总访问量
  • 21
    原创
  • 1,468,755
    排名
  • 48
    粉丝
  • 0
    铁粉

个人简介:接小型爬虫任务,价格视情况决定

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖北省
  • 加入CSDN时间: 2017-03-19
博客简介:

kr2563的博客

查看详细资料
个人成就
  • 获得47次点赞
  • 内容获得21次评论
  • 获得386次收藏
  • 代码片获得678次分享
创作历程
  • 1篇
    2022年
  • 2篇
    2021年
  • 6篇
    2020年
  • 4篇
    2019年
  • 9篇
    2018年
成就勋章
TA的专栏
  • leetcode找工作
    1篇
  • pytorch
    3篇
  • 统计学习方法代码实现
  • JAVAWEB
    1篇
  • python
    7篇
  • 编程
    8篇
  • NLP学习
    1篇
兴趣领域 设置
  • 人工智能
    nlp
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

LeetCode动态规划剑指offer48最长不含重复字符串

LeetCode动态规划剑指offer48最长不含重复字符串
原创
发布博客 2022.01.21 ·
348 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

CUDA Error: illegal error memory access 踩坑

笔者在实现一个transformer时,将nn.LayerNorm()层放到了Add_Norm模块的forward函数里,将模型搬到GPU上时一直报错,排查以后尝试将nn.LayerNorm替换为F.layer_norm,就没问题了!
原创
发布博客 2021.11.28 ·
1537 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pytorch geometric安装

在安装pytorch geometric时,根据需要安装如上四个依赖库,笔者在直接使用pip install安装前三个依赖时很顺利,但是在安装torch-spline-conv时一直报错ERROR: Command errored out with exit status /torch-spline-conv Check the logs for full command output.在研究一会儿之后,认为是版本不符合的问题。于是直接去https://pytorch-geometric.com/whl/下
原创
发布博客 2021.03.29 ·
283 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

数据预处理tricks

数据预处理 如果是表达类型的某一特征数据,比如一周七天,我们不能单纯用0,1,2,3,4,5,6进行区分,因为把这七个数字投入到网络和某一个w进行乘法运算时,数字越大,影响越大,而实际上这七个数字只是表示一周不同的每一天,这与实际情况严重不符,我们可以采用one hot 编码,全部变成七位的编码,如0:1000000, 1:01000000等等。 不同列的特征的分布值域可能有大有小,有的多达成百上千,有的不到1,这样就会造成结果偏差,所以可以对每一列进行归一化处理,全部变成标准正态分布。
原创
发布博客 2020.12.12 ·
162 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python List赋值操作

笔者在近期写代码时遇到一个有趣的问题,就是关于List赋值的事情。比如A = [1,2,3,4],假如把A赋值给B,即B=A,如果接下来我们对B进行B+=B操作,然后输出A,会发生什么事情呢?我们可以看到如下的结果,也就是对B的操作也影响到A了。A = [1, 2, 3, 4]B = AB += Bprint(A)# [1, 2, 3, 4, 1, 2, 3, 4]这是因为,在Pyhon中,List是当成一个类看待的,而A是类型为List的一个对象,python里面.
原创
发布博客 2020.12.07 ·
866 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

gensim计算余弦相似度采坑

假设有两个np.array, x1, x2x1 = np.array([1, 2, 3])x2 = np.array([2, 3, 4])如果将x1,x2直接投入cosine_similarity()计算会报错,需要将x1 reshape(1, -1),变成x1 = array([[1, 2, 3]]), x2同样处理。此外,计算出来的结果是array([[0.99258333]])形式,如果需要取出计算结果,用array[0][0],我在这里天真的将这个数据直接投进我的网络结构进行训练,一
原创
发布博客 2020.11.19 ·
1070 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

numpy获取邻接矩阵非0元素索引

假设邻接矩阵为A(dtype=array),idx = np.nonzeros(A) 可以取出所有的非0元素的位置,返回值是两个tuple,形式如下:(array([*,*,....,*]),array([*,*,.....,*])),第一行是行索引,第二行是列索引。假设用linklist = [] 存取完整索引,for i, j in zip(idx[0], idx[1]): linklist.append(i, j)...
原创
发布博客 2020.11.14 ·
1141 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 读取dat文件,显示合法中文

with open(filename, 'rb') as f: lines = f.readlines() for line in lines: print(str(line, encoding='ansi'))只需要用ansi编码处理即可,下面是处理前的数据样式:处理后:尊重原作,转载请注明,转载自:https://blog.csdn.net/kr2563...
原创
发布博客 2020.11.08 ·
1834 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

Pytorch获取梯度、修改网络参数

pytorch 获取某一参数x计算的梯度, x.gradpytorch修改网络参数:pytorch不支持直接修改某一参数,但是可以将model 的state_dict取出来,赋值给另一变量model_state_dict,在model_state_dict中进行修改以后再用model.load_state_dict(model_state_dict)加载,就可以完成修改。尊重原作,转载请注明,转载自:https://blog.csdn.net/kr2563...
原创
发布博客 2020.11.07 ·
2716 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

java.sql.SQLException: #22001 at com.mysql.jdbc.SQLError.createSQLException

这个问题很有可能是你想要插入数据库的数据所占的字符字节数超过了你数据库中分配的大小,笔者多次遇到的都是这个原因
原创
发布博客 2019.12.28 ·
3468 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

DES算法代码实现

DES是一个16轮的Feistel型结构密码,它的分组长度为64比特,用一个56比特的密钥来加密一个64比特的明文串,输出一个64比特的密文串。其中,使用密钥为64比特,实用56比特,另8位用作奇偶校验。加密的过程是先对64位明文分组进行初始置换,然后分左、右两部分分别经过16轮迭代,然后再进行循环移位与变换,最后进行逆变换得出密文。加密与解密使用相同的密钥,因而它属于对称密码体制。假设输入的明文...
原创
发布博客 2019.06.05 ·
15091 阅读 ·
18 点赞 ·
5 评论 ·
98 收藏

python爬取微博评论(通过xpath解析的方式)

前段时间笔者写了一份儿爬取微博评论的代码,是用了http://m.weibo.cn的接口,通过这个接口比较好的是代码比较好写,因为数据都是json格式的,规律性非常直观,属性json数据和字典操作的朋友都可以很快掌握,但是这个有个比较大的问题是基本限制了前一百页的内容爬取,而且cookie过期的比较快,所以现在提供一种新的方式是通过xpath方式解析http://www.weibo.cn这个入口。...
原创
发布博客 2019.04.12 ·
5374 阅读 ·
1 点赞 ·
2 评论 ·
16 收藏

python爬取中国知网(中国优秀硕士学位论文数据库)

笔者这几天受团队任务安排,需要写一份儿关于知网(中国优秀硕士学位论文数据库 入口:http://gb.oversea.cnki.net/kns55/brief/result.aspx?dbPrefix=CMFD)的代码,主要是爬取论文的作者信息、论文副标题、学位授予年度、学校、引用频次等,例如在关键词搜索一下医疗保险:表格的相关信息都可以爬取,点进每一篇文章以后,对应的关键词、副标题信...
原创
发布博客 2019.04.04 ·
7359 阅读 ·
1 点赞 ·
0 评论 ·
64 收藏

The CATALINA_HOME environment variable is not defined correctly 问题解决

前几天需要配置apache-tomcat,然后在我以为环境变量已经配置好以后,在cmd下输入startup.bat时,提示错误The CATALINA_HOME environment variable is not defined correctly This environment variable is needed to run this program。然后在网上找了一些解决的方法,...
原创
发布博客 2018.12.01 ·
8832 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Unicode equal comparison failed to convert both arguments to Unicode - interpreting问题解决

在写python爬虫时,在if s.get('item_name') == '性别': sex = s.get('item_content')这段代码的地方出现了上面的问题,意思是字符编码的问题,然后在网上查了一下,推荐的解决方式是import sysreload(sys)sys.setdefaultencoding('utf8')在代码前面添加如上几句语句,问题...
转载
发布博客 2018.11.28 ·
4797 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

windows程序设计之编写应用程序,当按下鼠标左键并在窗口中移动时,窗口中鼠标所经历的个点颜色设置为黑色

//Windows3.cpp: 定义应用程序的入口点。//#include "stdafx.h"#include "Windows3.h"#define MAX_LOADSTRING 100#define MAXPOINTS 1000LRESULT CALLBACK WndProc(HWND, UINT, WPARAM, LPARAM);int WINAPI WinMain...
原创
发布博客 2018.11.28 ·
5198 阅读 ·
1 点赞 ·
0 评论 ·
10 收藏

python爬取微博话题下面的帖子并存入excel文件

此次写的是python爬取微博话题下面的帖子,示例代码以爬取#转发这个杨超越#https://s.weibo.com/weibo/%23%E8%BD%AC%E5%8F%91%E8%BF%99%E4%B8%AA%E6%9D%A8%E8%B6%85%E8%B6%8A%23# -*- coding:utf-8 -*-__author__ = 'TengYu'import requests...
原创
发布博客 2018.11.28 ·
4989 阅读 ·
8 点赞 ·
9 评论 ·
56 收藏
加载更多