自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

herosunly的博客

阿里云天池大赛安全恶意程序检测第一名,科大讯飞比赛第一名,热衷于机器学习算法研究与应用。

  • 博客(13)
  • 资源 (176)
  • 收藏
  • 关注

原创 大数据处理经验(持续更新)

先取少量数据跑代码,确保代码没有语法和逻辑错误,再放到大量数据上面跑。

2020-03-29 20:20:24 6150 3

原创 使用PIL进行图片处理

1. 随机旋转和随机缩放from PIL import Imageimport numpy as npimport osdef scale_rotate_img(image, rotate_min=20, rotate_max=70, scale_min=0.4, scale_max=0.8): random_rotate = np.random.randint(rotate_m...

2020-03-27 11:28:58 9139

原创 MIT线性代数笔记二十六讲 复矩阵和快速傅里叶变换

1. 复向量 Complex vectors2. 复矩阵 Complex matrices3. 傅里叶变换 Fourier transform4. 快速傅里叶变换 Fast Fourier transform

2020-03-25 09:51:05 337

原创 Pytorch使用汇总

1. 不要在循环训练中直接将loss进行append(cannot allocate memory)2. 如何实时查看内存或者GPU的使用情况:3. GPU显存未释放问题4. RuntimeError: CUDA out of memory.5. cuda10.0上面也能安装1.6版本6. 将tensorflow版本模型转换为pytorch版本7. transformer版本过高8. ImportError: libmkl_intel_lp64.so: cannot open shared o

2020-03-24 15:07:03 10566

原创 tensorflow.keras和tensorflow使用汇总(持续更新)

1. 查看可用计算资源2. 使用空闲的GPU3. tensorflow.keras.layers.CuDNNLSTM4. 保存和加载模型4.1 CPU和GPU版本4.2 自定义层5. No module named tensorflow.keras.engine6. from tensorflow.keras import initializers7. tensorflow.keras.preprocessing.sequence.pad_sequences8.多个GPU并行使用

2020-03-24 10:11:23 6713

原创 NLTK使用汇总

0. 如何离线安装NLTK1. LookupError: Resource not found.2. 分句、分词和停用词3. 词性标注和词形还原4. 分句5. N-gram

2020-03-22 17:52:32 6680 2

原创 Google Colab学习汇总

1. 如何在colab上打开tensorboard?1.1 安装ngrok!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip!unzip ngrok-stable-linux-amd64.zip1.2 run TensorBoard on Colab依次执行下面三个cell的代码:LOG_DI...

2020-03-19 11:12:48 5736

原创 MIT线性代数笔记二十五讲 对称矩阵和正定性

1. 对称矩阵 Symmetric matrices2. 实特征值 Real eigenvalues3. 正定矩阵 Positive definite matrices

2020-03-17 14:23:30 679 1

原创 NLP定义和机器翻译

1. NLP定义  NLP(自然语言处理)= NLU(自然语言理解)+ NLG(自然语言生成)。  自然语言理解(Natural Language Understanding)是使计算机理解自然语言(人类语言文字)等,重在理解(难道NLG就不需要理解语言了吗?)。具体来说,就是理解语言、文本等,提取出有用的信息(很像是数据挖掘),用于下游的任务。它可以是使自然语言结构化,比如分词、词性标注、句...

2020-03-13 17:26:16 5708 2

原创 Numpy和scipy学习汇总

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。今天给大家带来的文章是Numpy和scipy学习汇总,希望能对同学们有所帮助。

2020-03-11 11:07:25 11143 2

原创 MIT线性代数笔记二十四讲 马尔可夫矩阵和傅里叶级数

1. 马尔可夫矩阵 Markov matrices2. 傅里叶级数 Fourier series

2020-03-10 14:12:05 562 1

原创 Leetcode 24 Swap Nodes in Pairs

1.开篇X:DataX:DataX:Dataθ:Parameter\theta:Parameterθ:ParameterX=(x1x2...xN)T=X = (x_1\quad x_2 \quad... \quad x_N)^T = X=(x1​x2​...xN​)T=(x11x12...x1px21x22...x2p............xN1xN2...xNp)N×p\begin...

2020-03-04 20:20:59 2889

原创 Jupyter Notebook 14个问题及解决方案

0. ip能ping通,但是端口连不通1. Refusing to serve hidden directory, via 404 Error2. no connection to kernel jupyter3. 更换密码4. 安装R的kernel5. 如何关闭jupyter notebook进程6. jupyter notebook无法远程访问7. ERR_UNSAFE_PORT8. No module named functools_lru_cache9. ...10. .....

2020-03-03 11:20:51 16349

加利福尼亚州住房数据集,包括九个特征和一个目标值即房价,总共20640条数据,和sklearn中的california数据集相同

包括了房屋的经度、房屋的纬度、房龄、房间个数、卧室个数、街区内人口、街区内家庭总数、收入、房屋价值,和sklearn中的california数据集相同,可直接通过pandas.read_csv读取即可,适合sklearn无法正常加载的情况下使用,其中加载代码如下 ```python from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() ```

2023-01-04

将PDF转换成图片的依赖库文件

将PDF转换成图片的依赖库文件

2022-04-07

考研英语和考研政治答题卡

考研英语和考研政治答题卡,值得考研同学借鉴学习。尤其是考研英语的作文区域是画好了格子,考研政治的大题是空白区域,建议大家可以购买考研专用尺画线。

2022-03-24

哈工大ltp模型文件(3.4.0)

哈工大ltp模型文件(3.4.0)

2022-03-04

台湾清华大学微积分详细笔记

总共31个PDF文件。其中重点并详细介绍了如何高效学习微积分、极限、连续、微分、积分等核心概念。内容详尽,值得深入学习。

2022-03-02

企业网络资产及安全事件分析数据集

包含tcpflow、flow、db、login四个文件夹,tcpflow是记录TCP协议层的数据传输记录,flow日志是http请求中header的数据记录,db日志是记录数据库操作的日志(SQL语句的执行记录),login日志是记录登录结果的日志(包括POP、FTP、SMTP、SMB和数据库的登录记录)。

2022-02-23

MalwareTextDB数据集

MalwareTextDB数据集

2022-02-15

网络空间安全:挑战和机遇

网络空间安全:挑战和机遇,共46页PPT,内容详尽,值得深入学习。

2022-01-19

西安电子数字信号处理(高西全丁美玉第三版)课后答案

西安电子数字信号处理(高西全丁美玉第三版)课后答案,共37页word文档,内容详尽,值得深入学习。

2022-01-19

系统认证风险预测数据集

包括认证时间、用户名、认证ID、操作类型、首次认证方式、IP地址、IP类型、IP威胁级别、地点、客户端类型、浏览器来源、浏览器类型、浏览器版本、操作系统类型、操作系统版本号、设备型号、应用系统编码、应用系统类目、风险标识等信息。

2022-01-19

基于UEBA的用户上网异常行为分析的数据集

基于UEBA的用户上网异常行为分析的数据集

2022-01-18

Autoruns开机启动项管理工具

Autoruns开机启动项管理工具

2022-01-04

2021年NLP面试题

2021年NLP面试题

2021-12-29

Gartner Emerging Technologies: Emergence Cycle AI in Security

Gartner报告,Emerging Technologies: Emergence Cycle AI in Security,2020年10月份出版的内容。

2021-12-02

计算机硬件清晰图(20MB)

计算机硬件清晰图

2021-11-29

使用机器学习和深度学习对PE进行二分类和多分类

通过大量训练数据来训练模型后进行保存,提供了保存后的模型和新数据的预测代码。

2021-08-05

cs231n第一个大作业

cs231n第一个大作业对应的最起始版本

2021-07-21

中文分词文件(共20W个词)

中文分词文件(共20W个词)

2021-06-23

英文单词分割symspellpy库依赖词典

symspellpy是可以进行文本的纠错,也可以将连在一起的字母分割成若干个单词的。根据实践表示该文件还是比较好用的,该文件是它的字典库。具体使用可参考博客https://blog.csdn.net/herosunly/article/details/105513582

2021-05-20

Iowa Liquor Sales 爱荷华州酒销售数据集

该数据集包含有关含酒精饮料的单个容器或容器包装的销售名称,种类,价格,数量和销售地点的信息。

2021-05-08

Transformer PPT

介绍了为什么要引入self-attention、self-attention的基本原理、self-attention的矩阵表示、Multi-head self-attention、 Positional Encoding、seq2seq

2021-04-22

安卓手机运行Python代码的apk文件.zip

安卓手机运行Python代码的apk文件,详细使用流程地址为https://blog.csdn.net/herosunly/article/details/115742190

2021-04-15

Linux安装boost 1.55.0安装包和文档

Linux安装boost 1.55.0安装包和文档

2021-04-14

现代汉语动词表(共2K条)

现代汉语动词表(共2K条)

2021-03-29

VSCode_User_win64_1.54.3

VSCode_User_win64_1.54.3

2021-03-29

CNEWS新闻文档分类数据

CNEWS新闻文档分类数据,其中14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐

2021-03-26

北京市房屋租赁合同(自行成交版)

北京市房屋租赁合同(自行成交版)

2021-03-22

知识图谱构建与实战PPT

知识图谱构建与实战PPT

2021-03-21

系统方法教你找到女朋友

系统方法教你找到女朋友

2021-03-18

.基于大数据的智能安全防御体系建设PDF

.基于大数据的智能安全防御体系建设

2021-03-18

人工智能之信息检索与推荐

人工智能之信息检索与推荐

2021-03-17

AI技术赋能网络内容安全保障研究报告

AI技术赋能网络内容安全保障研究报告

2021-03-17

mixed_corpus_bert_base_model.bin

mixed_corpus_bert_base_model.bin

2021-03-17

股票投资智慧(900页)

包括股票基本知识、股票估值方法、内在价值分析、公司财务分析、行业竞争分析、宏观经济分析等内容,值得深入学习。

2021-03-17

数字图像处理课件(冈萨雷斯第三版)PPT

数字图像处理课件(冈萨雷斯第三版)PPT

2021-03-17

Kafka核心知识点讲解.docx

Kafka核心知识点讲解

2021-03-17

人工智能赋能安全案例集(100多页)

人工智能赋能安全案例集,100多页,内容详尽,值得学习。

2021-03-17

nltk离线下载文件

NLTK离线下载文件,解压后可使用分词、停用词、词性标注和词形还原、wordnet等功能,NLTK安装可参考https://blog.csdn.net/herosunly/article/details/105017811中的0. 如何离线安装NLTK

2021-03-09

nlpcc2013和2014对应数据

nlpcc2013和2014对应数据

2021-03-05

信息安全思维导图集合(共24个图)

包括防御技术、攻击技术、职业发展路径、技能成长等内容。

2021-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除