- 博客(13)
- 资源 (46)
- 问答 (1)
- 收藏
- 关注
原创 NLP以赛代练 Task5:基于深度学习的文本分类 2
基于深度学习的文本分类 2学习目标文本表示方法 Part3词向量1. Skip-grams原理和网络结构2. Skip-grams训练2.1 Word pairs and “phases”2.2 对高频词抽样2.3 Negative sampling3. Hierarchical Softmax3.1 霍夫曼树3.2 Hierarchical Softmax过程使用 gensim 训练 word2vecTextCNNTextRNN基于TextCNN、TextRNN的文本表示TextCNNTextRNN使用.
2020-07-28 21:59:13 363
原创 NLP以赛代练 Task4:基于深度学习的文本分类 1
基于深度学习的文本分类1基于深度学习的文本分类学习目标文本表示方法 Part2现有文本表示方法的缺陷FastText基于FastText的文本分类如何使用验证集调参结语 基于深度学习的文本分类与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。 学习目标学习FastText的使用和基础原理学会使用验证集进行调参 文本表示方法 Part2现有文本表示方法的缺陷在上一章节,我们.
2020-07-28 11:58:31 181
原创 NLP以赛代练 Task 3:基于机器学习的文本分类
基于机器学习的文本分类机器学习模型文本表示方法 Part1One-hotBag of WordsN-gramTF-IDF基于机器学习的文本分类Count Vectors + RidgeClassifierTF-IDF + RidgeClassifier 机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。机器学习有很多种分支,对于学习.
2020-07-25 22:26:57 216
原创 NLP以赛代练 Task 2:数据读取与分析
数据读取与分析数据读取数据分析句子长度分析类别分布字符分布统计数据分析的结论 数据读取import pandas as pdtrain_df = pd.read_csv('/Users/debroon/Desktop/train_set.csv', sep='\t', nrows=100)train_df.head() # 查看 top5 的数据不算前面的行号,第一列为新闻的类别,第二列为新闻的字符。 数据分析一切技术的出现都是为了解决现实问题,而现实问.
2020-07-22 22:37:41 293
原创 NLP以赛代练 Task 1:赛题理解
NLP以赛代练 Task 1题目题目求解的是什么已知什么要满足哪些条件解题思路TF−IDFTF-IDFTF−IDF + 余弦相似度来进行分类 题目比赛网址:https://tianchi.aliyun.com/competition/entrance/531810/information 题目求解的是什么将一篇文章归入到具体的类别中,一共有 141414 个明确了的候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。这是.
2020-07-21 20:26:49 349
原创 线性回归(Linear Regression)
线性回归算法原理与思想前置知识回归平均算法原理手工实现scikit−learnscikit-learnscikit−learn调包实现线性回归总结 算法原理与思想 前置知识 回归平均1877年,高尔顿(达尔文的表弟)在英国皇家科学院做了一个演示报告:回归平均。高尔顿这次演示的东西,被后世称为“高尔顿板”。它是一个平板,下部有很多垂直的槽,槽上面是一些排列成三角形的小格挡。让一个小球从最上方掉下去,它会经过各个隔挡的阻碍,最终落到一个竖槽里。每个小.
2020-07-11 19:56:42 1646
原创 二分查找的循环不变量全面解析
二分法原理模版实践 原理二分法:相较于顺序查找,二分法查找的不是单个元素,而是一个范围。利用数据中的规律不断的将搜索范围减半。比如,猜数字游戏。朋友让您在心目中想一个 1−10001-10001−1000 的数字,而后您问朋友问题,对方回答:YesNo您最多也只要用 101010 次一定能够猜出他心目中想的数字。第一次只要问朋友是否小于 500500500,如果TA给出了肯定的答案,说明数字在 1−4991-4991−499 里面,第二次折半问TA这个问题即可。类似地.
2020-07-09 21:23:14 1332
原创 Liberal Arts:志存高远
Liberal Arts:志存高远兴趣哲学:不断提高的认知健身:活力滋养自己编程:信息时代的思维方式总结:安顿自己的笨拙与孤独改变命运的决心自信与热情思维的简化学习的学习长期的知识结语 人生在世会面对各种问题,我们可以分为三类:单纯问题:有明确的方向、有能让人放心的答案(标准的答案)。掌握的工具、模型、视角,以及是否聪明决定了解决问题的上限。 俩难问题:左右为难,不好取舍,但又必须作出取舍。需要的是大脑对世界的认知,个人价值观。 棘手问题:无.
2020-07-09 20:51:08 3377 1
原创 奇异值分解实验:图像压缩与推荐系统
奇异值分解实验奇异值分解低秩近似工程应用:图像压缩工程应用:推荐系统 奇异值分解只有方阵(行数等于列数)才能做特征值分解,非方阵可不可以分解为 333 个矩阵的乘积呢?这种方式是【奇异值分解】,这种方法大学里并不学。因为本科的线性代数主要研究方阵(除了线性系统),所以大学里并没有介绍非方阵的奇异值分解(SVDSVDSVD),奇异值分解在数据降维、语义分析、图像等领域都有十分广泛的应用,比如 PCAPCAPCA 算法里如果用数据矩阵的奇异值分解代替协方差矩阵的特征值分解,速度更快。.
2020-07-05 16:38:43 638
原创 特征值分解实验:人脸识别与PageRank网页排序
特征值分解实验特征值与特征向量特征值分解实对称矩阵工程应用:主成分分析(Principal Component Analysis)数学推导示例工程应用:人脸识别马尔可夫过程工程应用:网页排序 特征值与特征向量矩阵乘法对应一个线性变换,把输入的任意一个向量,变成另一个方向或长度都改变的新向量,在这个变换的过程中,原来的向量主要发生了旋转、伸缩的变换。特别情况,存在某些向量使得变换矩阵作用于 TA 们时,只对长度做了伸缩的变换,却不对输入向量产生旋转的变换(不改变原来向量的方向),这些.
2020-07-04 20:29:57 638
原创 [5] 前端渗透测试
我很开心,到这,您应该是看完了,《Web通信原理》 《Web前后端基础》 《信息收集》 《SQL注入》 我不知道您是否看懂了,有错别字或语句不通的地方还请 call 我(23609099-Q)。 因为我还是会继续写下去,我学习安全喜欢边学边写。 ...
2020-07-03 09:17:19 4370 2
原创 [6] 支付漏洞( 0 元购 )
《目录》原理:支付漏洞 实战:无限话费 如何挖掘 案例:修改支付的价格 案例:修改支付状态 案例:修改订单数量 案例:无限制试用 如何防御 支付漏洞常见问题汇总 支付漏洞,是一种很简单的逻...
2020-07-03 08:56:11 5843 8
原创 线性系统实验:化学方程式配平 与 天体轨道参数估计
线性系统消元法高斯消元法高斯-约旦消元法工程应用:化学方程式配平逆矩阵求解解的结构超定方程组近似估值工程应用:天体轨道参数估计 消元法线性系统,在高中称为 多元一次方程组,因为在线性代数里,我们把矩阵看成系统,而这些方程组的未知数都只有一次,所以就了线性系统。{1x+2y=53x+4y=6\left\{\begin{matrix}1x + 2y = 5 & \\ 3x + 4y = 6 & \end{matrix}\right.{1x+2y=53x+4y=6.
2020-07-01 19:18:21 881
博客配套https://download.csdn.net/download/qq_41739364/86339152
2022-08-05
att_faces.zip
2020-07-04
0day安全:软件漏洞分析技术(第2版)一 PART2.pdf
2019-07-17
0day安全:软件漏洞分析技术(第2版)一 PART1.pdf
2019-07-17
渗透测试实践指南:必知必会的工具与方法.pdf
2019-06-28
C++求救,一道编程题不知道怎么做
2021-03-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人