自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

herosunly的博客

阿里云天池大赛安全恶意程序检测第一名,科大讯飞比赛第一名,热衷于机器学习算法研究与应用。

  • 博客(12)
  • 资源 (176)
  • 收藏
  • 关注

原创 知识图谱在风控上的应用

1. 搭建风控算法流程  整体流程为:已经构建好的KG(知识图谱)->特征工程->模型。  风控知识图谱中一般包括进件、申请人、电话等实体,其中进件指的是资料准备好后提交给贷款公司或银行的系统里面。特征工程指的是围绕某个申请人提取出一些有效的特征或者信息。1.1 特征工程  特征分为两大类特征:申请人相关特征和从知识图谱中提取出的特征。  其中申请人相关特征:年龄、收入、工作...

2019-12-31 16:41:37 16450

原创 Neo4j Cypher总结

  CQL代表Cypher查询语言。https://blog.csdn.net/qq_37503890/article/details/101382876

2019-12-30 10:44:14 10869

原创 Neo4j、APOC、JDBC

1. Neo4j介绍1.1 数据库划分  金融企业使用Oracle和DB2比较多。1.2 图数据库的数据存储形式  实体(Node,用圆圈表示)、实体分类(Node Label,为实体括号中的结果)、关系(Relationship,用箭头表示)、关系类型(Relationship type )、属性。在这个例子中,我们在Node的Circle中的整数表示了每个Node的id属性。1...

2019-12-26 17:37:10 53498 2

原创 知识图谱基础

1. 什么是知识图谱  第一种理解:知识图谱本质上是语义网络。本体论是语义网络中最重要的一个要素。  第二种理解:知识图谱也叫做多关系图,由多种类型的节点和多种类型的边组成。课程以第二种理解为主。2. 构建知识图谱所需要的技术数据获取:数据爬取(公开,半公开数据,其中半公开的数据指的是需要验证码识别或者模拟登陆的数据)、数据库读取(业务数据)。数据预处理:数据清洗(例如字段对齐)...

2019-12-26 13:17:59 3820 5

原创 如何在安卓系统上运行Python程序

安装QPython3: https://github.com/qpython-android/qpython3/releases/tag/2.1.0-L 。安装QPython: https://github.com/qpython-android/qpython/releases/tag/2.4.3。安装QPy3.6: https://github.com/qpython-android/q...

2019-12-25 16:52:50 3018 3

原创 感知机实现代码

1. 线性可分数据1.1 读取数据import pandas as pdimport numpy as npfrom sklearn.metrics import accuracy_scoredata = pd.read_csv(r'E:/data/perceptron_15.dat', sep = '\s', header = None)data.columns = ['x1', ...

2019-12-16 13:17:48 12731 2

原创 感知机收敛性(Novikoff定理证明)

  存在超平面(超平面法线向量为w^opt\hat{w}_{opt}w^opt​,∣∣w^opt∣∣=1||\hat{w}_{opt}||=1∣∣w^opt​∣∣=1,超平面方程为x^⋅w^opt=x⋅wopt+bopt=0\hat{x} \cdot \hat{w}_{opt}=x \cdot w_{opt}+b_{opt}=0x^⋅w^opt​=x⋅wopt​+bopt​=0)。其中w^opt\...

2019-12-12 17:47:58 12719 1

原创 频率派和贝叶斯派

1. 理论详解1.1 频率派1.2 贝叶斯派2. 实例分析2.1 频率派2.2 贝叶斯派3. 总结

2019-12-12 11:22:06 11074 2

原创 MIT线性代数笔记二十二讲 矩阵对角化和矩阵的幂

1. 对角化矩阵 Diagonalizing a matrix $S^{−1}AS$ = Λ2. 矩阵的幂 Powers of A3. 重特征值 Repeated eigenvalues4. 差分方程 Difference equations $u_{k+1}=Au_k$5. 斐波那契数列 Fibonacci sequence

2019-12-11 17:16:03 714 1

原创 概率论知识点误区

1. 为什么要写这篇博客?  最近在和几个小伙伴一起复习《统计学习方法》。由于该书为经典教材,所以采用一字不差的方法进行阅读。但在学习过程中遇到了各种各样的问题,总结了一下原因,其中很重要的一点是基本概念理解不透彻(甚至从来就没理解)。所以将概率论的容易理解错误而且至关重要的基本概念整理出来,从而方便大家学习。2. 基本概念2.1 什么是随机变量?  随机变量并不是变量,而是函数,它是把随...

2019-12-11 11:31:05 13876 1

原创 概率论知识复习

1. 随机变量  随机变量不是变量,而是实验结果的函数。它是把实验结果进行数字化的函数。XXX2. 概率论和数理统计的关系是什么?  概率论是数理统计的基础,而数理统计是概率论的应用。数理统计是通过采集数据、数据分析、得出尽可能正确的结论。其中数据分析指的是选择模型和参数估计。而选择模型和参数估计就会用到概率论。2.1 为什么得到的是尽可能正确的结论  采集数据本质上是对总体进行采样,只............

2019-12-04 15:26:17 6909 2

原创 Latex和Markdown中的数字字体和数学符号

  在书籍和论文中,数学字体是必不可少的,但是很多同学并不清楚具体的内容,现在简单总结下,持续更新。数学字体符号表示效果展示粗体(boldface)\mathbf{}R\mathbf{R}R黑板粗体(blackbold)\mathbb{}R\mathbb{R}R美术字(calligraphy)\mathcal{}L\mathcal{L}L...

2019-12-02 11:09:04 3812

加利福尼亚州住房数据集,包括九个特征和一个目标值即房价,总共20640条数据,和sklearn中的california数据集相同

包括了房屋的经度、房屋的纬度、房龄、房间个数、卧室个数、街区内人口、街区内家庭总数、收入、房屋价值,和sklearn中的california数据集相同,可直接通过pandas.read_csv读取即可,适合sklearn无法正常加载的情况下使用,其中加载代码如下 ```python from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() ```

2023-01-04

将PDF转换成图片的依赖库文件

将PDF转换成图片的依赖库文件

2022-04-07

考研英语和考研政治答题卡

考研英语和考研政治答题卡,值得考研同学借鉴学习。尤其是考研英语的作文区域是画好了格子,考研政治的大题是空白区域,建议大家可以购买考研专用尺画线。

2022-03-24

哈工大ltp模型文件(3.4.0)

哈工大ltp模型文件(3.4.0)

2022-03-04

台湾清华大学微积分详细笔记

总共31个PDF文件。其中重点并详细介绍了如何高效学习微积分、极限、连续、微分、积分等核心概念。内容详尽,值得深入学习。

2022-03-02

企业网络资产及安全事件分析数据集

包含tcpflow、flow、db、login四个文件夹,tcpflow是记录TCP协议层的数据传输记录,flow日志是http请求中header的数据记录,db日志是记录数据库操作的日志(SQL语句的执行记录),login日志是记录登录结果的日志(包括POP、FTP、SMTP、SMB和数据库的登录记录)。

2022-02-23

MalwareTextDB数据集

MalwareTextDB数据集

2022-02-15

网络空间安全:挑战和机遇

网络空间安全:挑战和机遇,共46页PPT,内容详尽,值得深入学习。

2022-01-19

西安电子数字信号处理(高西全丁美玉第三版)课后答案

西安电子数字信号处理(高西全丁美玉第三版)课后答案,共37页word文档,内容详尽,值得深入学习。

2022-01-19

系统认证风险预测数据集

包括认证时间、用户名、认证ID、操作类型、首次认证方式、IP地址、IP类型、IP威胁级别、地点、客户端类型、浏览器来源、浏览器类型、浏览器版本、操作系统类型、操作系统版本号、设备型号、应用系统编码、应用系统类目、风险标识等信息。

2022-01-19

基于UEBA的用户上网异常行为分析的数据集

基于UEBA的用户上网异常行为分析的数据集

2022-01-18

Autoruns开机启动项管理工具

Autoruns开机启动项管理工具

2022-01-04

2021年NLP面试题

2021年NLP面试题

2021-12-29

Gartner Emerging Technologies: Emergence Cycle AI in Security

Gartner报告,Emerging Technologies: Emergence Cycle AI in Security,2020年10月份出版的内容。

2021-12-02

计算机硬件清晰图(20MB)

计算机硬件清晰图

2021-11-29

使用机器学习和深度学习对PE进行二分类和多分类

通过大量训练数据来训练模型后进行保存,提供了保存后的模型和新数据的预测代码。

2021-08-05

cs231n第一个大作业

cs231n第一个大作业对应的最起始版本

2021-07-21

中文分词文件(共20W个词)

中文分词文件(共20W个词)

2021-06-23

英文单词分割symspellpy库依赖词典

symspellpy是可以进行文本的纠错,也可以将连在一起的字母分割成若干个单词的。根据实践表示该文件还是比较好用的,该文件是它的字典库。具体使用可参考博客https://blog.csdn.net/herosunly/article/details/105513582

2021-05-20

Iowa Liquor Sales 爱荷华州酒销售数据集

该数据集包含有关含酒精饮料的单个容器或容器包装的销售名称,种类,价格,数量和销售地点的信息。

2021-05-08

Transformer PPT

介绍了为什么要引入self-attention、self-attention的基本原理、self-attention的矩阵表示、Multi-head self-attention、 Positional Encoding、seq2seq

2021-04-22

安卓手机运行Python代码的apk文件.zip

安卓手机运行Python代码的apk文件,详细使用流程地址为https://blog.csdn.net/herosunly/article/details/115742190

2021-04-15

Linux安装boost 1.55.0安装包和文档

Linux安装boost 1.55.0安装包和文档

2021-04-14

现代汉语动词表(共2K条)

现代汉语动词表(共2K条)

2021-03-29

VSCode_User_win64_1.54.3

VSCode_User_win64_1.54.3

2021-03-29

CNEWS新闻文档分类数据

CNEWS新闻文档分类数据,其中14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐

2021-03-26

北京市房屋租赁合同(自行成交版)

北京市房屋租赁合同(自行成交版)

2021-03-22

知识图谱构建与实战PPT

知识图谱构建与实战PPT

2021-03-21

系统方法教你找到女朋友

系统方法教你找到女朋友

2021-03-18

.基于大数据的智能安全防御体系建设PDF

.基于大数据的智能安全防御体系建设

2021-03-18

人工智能之信息检索与推荐

人工智能之信息检索与推荐

2021-03-17

AI技术赋能网络内容安全保障研究报告

AI技术赋能网络内容安全保障研究报告

2021-03-17

mixed_corpus_bert_base_model.bin

mixed_corpus_bert_base_model.bin

2021-03-17

股票投资智慧(900页)

包括股票基本知识、股票估值方法、内在价值分析、公司财务分析、行业竞争分析、宏观经济分析等内容,值得深入学习。

2021-03-17

数字图像处理课件(冈萨雷斯第三版)PPT

数字图像处理课件(冈萨雷斯第三版)PPT

2021-03-17

Kafka核心知识点讲解.docx

Kafka核心知识点讲解

2021-03-17

人工智能赋能安全案例集(100多页)

人工智能赋能安全案例集,100多页,内容详尽,值得学习。

2021-03-17

nltk离线下载文件

NLTK离线下载文件,解压后可使用分词、停用词、词性标注和词形还原、wordnet等功能,NLTK安装可参考https://blog.csdn.net/herosunly/article/details/105017811中的0. 如何离线安装NLTK

2021-03-09

nlpcc2013和2014对应数据

nlpcc2013和2014对应数据

2021-03-05

信息安全思维导图集合(共24个图)

包括防御技术、攻击技术、职业发展路径、技能成长等内容。

2021-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除