自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

herosunly的博客

阿里云天池大赛安全恶意程序检测第一名,科大讯飞比赛前五名,热衷于机器学习算法研究与应用。

  • 博客(217)
  • 资源 (74)
  • 论坛 (1)

原创 机器学习之Python、Linux、Git、Tensorflow入门教学大纲

学习方法核心思想Python基础2.1 Python运行环境(Jupyter Notebook)2.2 编程规范2.3 基本语法2.4 函数式编程2.5 面向对象2.6 文件操作数据处理常用库Numpy数据处理常用库Pandas(DataFrame、Series等)Linux常用命令Git和Github...

2020-10-09 20:17:28 5374 9

原创 大咖论赛——阿里云天池TOP选手不得不说的那些事儿

  我是安全恶意程序检测的冠军,我和几个大佬一起分享了一些入门比赛和提高比赛成绩的方法, 可点击回放链接学习 ,或者复制https://live.csdn.net/room/broadview2006/tkVYVbSb到浏览器中学习。

2020-09-25 10:09:01 4513 7

原创 TF 2.0 + PyTorch学习汇总

  为了方便自己和其他人查阅笔记,特意将自己的学习笔记链接汇总整理到该博文中。Tensorflow简介TensorFlow2.0 Hello worldTF 2.0构建最简单的神经网络TensorFlow 2.0 实现线性回归和非线性回归TF 2.0解决回归问题TensorFlow 2.0 对MNIST数据进行分类包括层数加深、Dropout、正则化、CNN...

2019-12-17 17:46:04 439 5

原创 李宏毅机器学习笔记汇总

  为了方便自己和其他人查阅笔记,特意将自己的学习笔记链接汇总整理到该博文中(感谢彦强的提醒)。章节简介1 - Introduction机器学习基本概念2 - Regression回归3 - Bias and Variance偏差和方差4 - Gradient descent梯度下降5 - Classification分类6 - Log...

2019-11-08 14:55:12 318 5

原创 2020年1024程序员节,成为CSDN博客专家

文章目录1. 节日礼物2. 和CSDN一起成长2.1 成长伊始2.2 新的问题1. 节日礼物  打开在CSDN的第一篇博客《PAGE_FAULT_IN_NONPAGED_AREA解决》,时间回首到2015年,那时候的初入CSDN的我可曾想到若干年后能成为博客专家呢。五年的时光承载了太多的成长和回忆,但回想下这些年的程序员节,这个酷酷的荣誉是送给自己最好的节日礼物。2. 和CSDN一起成长2.1 成长伊始  在很长的一段时间内,成长的速度极其缓慢,可能还不如一步一步往上爬的蜗牛,只是因为走了太多的

2020-10-24 21:03:17 2037 16

原创 一文掌握Python正则表达式

文章目录1. 正则表达式的定义和应用2. 语法2.1 Python默认的1. 正则表达式的定义和应用  正则表达式定义了字符串搜索或者匹配的模式。通常该模式会使用在字符串的查找或者查找并替换的操作。该概念产生于1950年左右,是由美国数学家Stephen Cole Kleene发明的。该概念已广泛应用于Unix文本处理程序。 自1980年以来,正则表达式的语法主要分为两种,一种是POSIX标准,另一种是更为常用的Perl语法。  正则表达式的应用可谓无处不在。常用于搜索引擎、文本编辑器(比如我最常用的

2020-10-21 17:14:24 563 8

原创 初试所需资料和复习时间安排

文章目录1. 总原则1. 政治2. 英语3. 数学1. 总原则  针对考研初试而言,复习资料的重要性是不言而喻的。好的复习资料必然会使复习的效率事倍功半。  那先谈一下什么样的资料是好的资料呢?原命题组组长或者成员出的书质量会好一些。就拿为什么肖四每年会有很多原题,是因为肖秀荣以前是政治命题组的副组长。强烈不建议使用xx芬的资料,他以前不是学政治出身(半路出家)。而英语资料的话,黄宝书也就是张剑以前也是命题人(不是组长)。具体人名和资料名仅仅是抛砖引玉,希望大家通过自己的努力搜索到更有价值的信息。1

2020-10-19 21:29:41 139 7

原创 真题做题方法总结

  无论是考研、高考还是考公,真题都是及其重要的。因为只有通过真题才能更好的了解命题人的思路。关于如何更好的了解命题人的思路,可参考文章考研思维方式分享 。  有不少同学做纸质版的真题极其随意,顺手就把当时计算出来的答案写到了真题上。如果把真题当成一次性练习,这样做未尝不可。但是真题只有反复的做,不断的琢磨命题人的思路,才会发挥其最大的价值。也就是要把书读厚,再把书读薄。所以正确的操作方法如下所示:  每一次练习的答案一定要写到草稿纸或者笔记本(本子,非电脑)上,而不要写到真题题目后,然后在真题题目后只

2020-10-19 20:59:54 1885 23

原创 英语背单词秘籍

  背单词是大型英语中极为基础但却至关重要的一步。但很多同学都在此步中就踩了坑,比如买了一本厚厚的单词书开始背起,无论是正序版或者是乱序版,最终的结果往往不如人意。一来真正熟悉的可能就是前20%的单词,而来可能只掌握的是单词对应的某个字面意思,但往往考试中可能考到的另外一个意思就会吃亏。要想在背单词上超越其他人,就不能偷懒,必须整理出属于自己的英语单词本。那该怎么去做呢?  为了加深记忆,并且更好的理解单词的语义,还是得在阅读理解中挖掘单词、整理单词,具体步骤是找一个崭新的笔记本(本子),然后把一页用尺子

2020-10-19 20:17:36 777 8

原创 Pycharm使用图解

文章目录1. 新建项目2. 窗口介绍3. Pycharm设置4. Pycharm菜单中的功能1. 新建项目  Pycharm是根据项目组织的,项目相关的配置文件存放在项目文件夹下的.idea文件夹(隐藏文件夹)中。  新建环境可以通过Virtualenv进行创建,也可以通过Conda进行创建。  下方状态栏如下所示说明Pycharm正在对选定的Python解释器进行索引工作,在这个过程中,Pycharm的自动补全和代码高亮都暂时无效。2. 窗口介绍新建文件File: 空文件Dir

2020-10-19 19:04:35 1179 10

原创 Python处理mdb和csv文件

文章目录1. 环境配置2. 导库3. mdb和csv数据关联3.1 读取解压数据3.1.1 判断文件是否存在3.1.2 读取解压数据3.2 csv数据过滤和处理3.3 mdb数据读取3.4 mdb和csv数据关联4. 对csv数据进行函数式编程处理5. 通过SQL语句操作mdb数据库5.1 读取mdb数据5.2 查询并添加列5.3 逐行操作mdb数据库6. 相似性关联数据6.1 相似性比较6.2 关联数据7. 任务描述1. 环境配置  mdb文件是Office Access数据库文件。要使用Python

2020-10-16 17:26:34 2677 5

原创 Python代码练习

文章目录0. 写在前面的话1. 题目2. 解答0. 写在前面的话  初学者学习Python,最重要的就是刻意练习(技术无他,唯有熟尔)。为了帮助初学的同学检验自己的Python水平,特意出十道代码练习题。练习题涉及到之前讲多的大多数核心知识点,但由于题目有限,可能会遗留部分重要知识,所以希望能把功夫用在平时,不断提升和积累自己的代码能力。虽然将答案附在最后以供参考,但希望一定要自己亲手练习,然后比较自己的代码和我的代码之间的差异之处,差异之处也就是需要提高之处。比如编程规范、算法、压力测试等。(注:此篇

2020-10-16 15:29:38 5253 13

原创 Python数据分析之批量统计excel文件

1.导库其中xlrd是read_excel需要的。import zipfileimport osimport pandas as pdimport osimport xlrdimport jsonimport pygeoip2. 批量解压zip文件  由于给定的文件夹中文件鱼龙混杂,还有文件名中包括空格(这是多大的怨念才这么命名的啊),所以必须加上异常处理,然后通过后缀名去解压。def unzip_folder_all_zip(src_root): for rt, dirs,

2020-10-16 09:13:15 3638 14

原创 新手必学的Linux常用命令

文章目录0. windows远程控制Linux的软件1. Linux命令简要说明2. 参数的左手原则3. 文件和目录的基本操作3.1 cd(Change the current directory to dir)3.2 ls(list directory contents)3.3 chmod(change mode)3.4 pwd(print name of current/working directory)3.5 增删改查3.5.1 mkdir(创建目录)3.5.2 touch(创建文件)3.5.3 r

2020-10-14 22:30:41 3830 5

原创 Python文件操作

文章目录1. 文件类型1.1 曾经遇到的坑1.2 文本文件 vs. 二进制文件1.3 Linux file命令2. 文件读写2.1 普通文本文件2.2 json文件2.3 csv、tsv等格式文件2.4 excel文件2.5 文件序列化3. 文件路径迭代3.1 os.walk3.2 glob1. 文件类型1.1 曾经遇到的坑  对于初学者来说,非常容易犯的一个错误就是认为后缀名等同于实际的文件类型。虽然大部分的确如此,但是偶尔遇到一两次(我曾经遇到过把xlsx文件后缀名修改成了csv)也会耗费不少的

2020-10-14 19:42:50 3541 6

原创 Pandas DataFrame核心点总结

文章目录1. pandas.DataFrame 数据结构1.1 创建DataFrame1.2 DataFrame的基本属性和常用方法1.2.1 基本属性1.2.2 常用方法1.3 选择数据1.3.1 loc1.3.2 iloc1.4 修改数据2. Groupby and Aggregate2.1 聚合操作(aggregate)2.2 GroupBy对象的基本属性2.3 多列进行GroupBy2.4 对GroupBy对象进行迭代2.5 transform和apply和map2.6 filter3. 表格匹

2020-10-13 22:57:58 1424 15

原创 Pandas Series核心点总结

文章目录1. Pandas简介2. Pandas数据结构Series2.1 构造和初始化Series2.2 Series的基本属性2.3 选择数据2.4 赋值运算2.5 数学运算1. Pandas简介Python数据分析的核心库之一基于Numpy (对ndarray的操作)更能体会到Python的Functional Programming(函数式编程)适合自学的资料(http://pandas.pydata.org/pandas-docs/stable/)2. Pandas数据结构Seri

2020-10-13 19:11:28 5608 6

原创 Numpy核心知识点总结下

文章目录5. numpy.array 中的运算6. Numpy 中的聚合操作7. Numpy 中的arg运算8. Numpy 中的比较和Fancy Indexing5. numpy.array 中的运算6. Numpy 中的聚合操作7. Numpy 中的arg运算8. Numpy 中的比较和Fancy Indexing

2020-10-12 22:38:06 4977 4

原创 Windows系统查看连接过的WIFI密码

  首先打开CMD(可通过windows+R打开运行,然后输入cmd)。  以下命令会显示所有的连接过WIFI的密码:for /f "skip=9 tokens=1,2 delims=:" %i in ('netsh wlan show profiles') do @echo %j | findstr -i -v echo | netsh wlan show profiles %j key=clear  但如果只想获得某个指定WIFI名称的密码,该怎么操作呢?首先通过命令得到WIFI名称的列表,命令

2020-10-12 17:36:58 92 2

原创 Numpy核心知识点总结上

文章目录1. numpy.array 基础1.1 Python List vs. Python array vs. Numpy array1.2 初始numpy.array2. 创建 numpy.array2.1 Python range vs. np.arange vs. np.linspace2.2 随机函数2.2.1 np.random.randint2.2.2 np.random.random2.2.3 np.random.normal2.2.4 np.random.seed2.3 其他常用函数3.

2020-10-12 16:58:32 5613 6

原创 2.5 Python面向对象

文章目录1. 关于类与对象操作的BIFs2. 面向对象OOP2.1 类的创建与内部结构2.2 类的继承与多态2.3 OOP三大特性总结3. 模块与包1. 关于类与对象操作的BIFstype() 返回对象类型id(), 查看对象iddir(), 查看对象下变量及函数issubclass(), isinstance(), super(),类,实例,调父类hasattr(), getattr(), setattr(), delattr()类属性操作globals(), locals(), 全局与局

2020-10-11 20:59:41 4960 10

原创 2.4 Python函数

文章目录1. 初识Python中的函数1.1 函数的结构1.2 函数的返回1.3 函数的参数1.4 参数传递的处理1.5 变量作用域(L->E->G->B)2. 各种函数2.1 匿名函数lambda2.2 偏函数2.3 高阶函数3. 闭包4. 装饰器1. 初识Python中的函数1.1 函数的结构1.2 函数的返回1.3 函数的参数1.4 参数传递的处理1.5 变量作用域(L->E->G->B)2. 各种函数2.1 匿名函数lambda2.2 偏函数2

2020-10-10 20:25:56 1497 2

原创 2.3 Python基本语法

文章目录1. Python基本语句和函数1.1 赋值语句1.2 循环与判断1.3 BIFs(内建函数)2. Python数据类型2.1 数值类型1. Python基本语句和函数1.1 赋值语句# 简单赋值a = 100# 多变量赋值a, b, c = 99, 100, 101print(a, b, c)# 变量交换(其他编程语言没有的特性)a, b = b, aprint(a, b)1.2 循环与判断for 迭代循环(此处和其他编程语言不一致)while 条件循环三元表

2020-10-10 08:52:19 4963 5

原创 2.2 Python编程规范

文章目录1. Python编程规范2. 检查工具3. 代码布局4. 表达式中的空格5. 命名规则6. 注释1. Python编程规范  编程规范是体现职业素养的一部分,其重要性不言而喻。那我们应该遵循什么样的编程规范呢?  对于Python语言,最常见的规范的PEP 8编程规范。  从谷歌搜索输入栏中,输入Python Code Style,第一个就是PEP 8编程规范:https://www.python.org/dev/peps/pep-0008/,由于篇幅有限,本文只总结了部分最常用的编程规范

2020-10-09 22:40:55 1146 4

原创 2.1 Python运行环境

文章目录1. Python运行环境概述2. Jupyter Notebook2.1 基本操作2.2 基本单元cell2.2.1 命令模式的快捷键2.2.2 编辑模式下的两种命令1. Python运行环境概述原生环境(通过官网下载安装包)PyCharm(学生邮箱可以免费使用专业版)Jupyter Notebook(可通过安装Anaconda)2. Jupyter Notebook  Jupyter Notebook作为一个软件,我们应该从以下几个角度进行学习:安装基本使用和操作(启动

2020-10-09 22:12:57 5628 11

原创 学习方法论

  工欲善其事,必先利其器。在开始学习具体知识之前,为了提高学习效率,特意花一些时间来讲讲学习方法。具体方法并不是最重要的,最大的希望能给大家带来一定的启发(抛砖引玉)。  个人的学习习惯是,首先理解关键概念的字面意思,然后再通过后期不断的实践和练习,逐渐加深对概念的理解。举例来说,现在谈到的是学习。对于学习来说,我们最容易想到的就是学而时习之,不亦乐乎。从上句可以看出,学习可以分为学和习,学很容易理解,习指的是不断的实践。我的体会是,在不断的学习和实践中一定要形成自己的理解。  话说回来了,那如何能够

2020-10-09 21:04:46 5064

原创 浏览器主页被hao123劫持之解决方案

  恰逢十一假期用朋友的电脑写博客,但是一打开chrome浏览器就先弹出http://ljd1.gndh666.top/,然后再跳转到hao123.com。hao123真的是太“良心”了,让人感动至极。吐槽归吐槽,还是得解决不是。整了一上午,终于解决了,来给大家分享一下解决的过程吧。  首先对桌面的chrome快捷方式点击右键,选择属性可得下图,发现末尾并没有包含非法URL地址:  然后再在chrome浏览器中输入chrome://version/,发现命令行为"C:\Users\admin\AppD

2020-10-02 12:24:55 1494

原创 考研复习之记忆方法

  写在前面的话:由于自己从双非院校考上了985学校,所以每年不定期的都要给家人及其朋友介绍自己成功的经验。再加上之前考上研究生后,曾经帮助数十个同学考上了211及其以上院校。但是步入工作以后,由于工作比较忙碌,所以也慢慢淡出了考研这个领域,但帮助别人的热忱之心却一直都在。为了帮助更多的朋友,所以特意将之前的经验整理成博文。遥想当年考研,就跟如今打数据科学比赛一样,时时刻刻都在想着怎么去提高分数,很多个晚上做梦都是考研的知识点,在这种状态下总结了不少独到的方法。本文主要是抛砖引玉,希望自己的经验不仅仅是帮助

2020-10-01 23:30:13 956 5

原创 考研各科题型分析

  写在前面的话:由于自己从双非院校考上了985学校,所以每年不定期的都要给家人及其朋友介绍自己成功的经验。再加上之前考上研究生后,曾经帮助数十个同学考上了211及其以上院校。但是步入工作以后,由于工作比较忙碌,所以也慢慢淡出了考研这个领域,但帮助别人的热忱之心却一直都在。为了帮助更多的朋友,所以特意将之前的经验整理成博文。遥想当年考研,就跟如今打数据科学比赛一样,时时刻刻都在想着怎么去提高分数,很多个晚上做梦都是考研的知识点,在这种状态下总结了不少独到的方法。本文主要是抛砖引玉,希望自己的经验不仅仅是帮助

2020-10-01 23:05:31 760 3

原创 考研战略分析

  作为一个爱学习的同学,从小到大一直就有个名校梦。想必很多同学和我一样,高考失利考到一个不入流的学校,所以特别想通过考研来园自己的名校梦。但时光不能倒流,我们只有客观的审视考研,判断考研真正适合自己以后再去考,这样才能有更大的胜算。  研究生的主旋律就是做研究,那如何做研究呢?首先要阅读前人的work,尤其是通过阅读paper来了解该领域的发展情况。然后自己提出并和导师讨论idea,之后再通过理论或者实验进行验证,如果验证成功以后再把科研成果通过某种形式进行发布(如paper、专利等)。所以把考研准备误

2020-10-01 22:02:50 747

原创 考研思维方式分享

  由于自己从双非院校考上了985学校,所以每年不定期的都要给家人及其朋友介绍自己成功的经验。为了帮助更多的朋友,所以特意将经验整理成博文。由于自己研究生毕业已经有些年头,所以具体知识点  ...

2020-10-01 19:07:06 775 7

原创 达观杯文本智能信息抽取挑战赛 四到十名队伍分享

文章目录1. 第四名 whoaido(徐恒)1.1 团队简介1.2 算法思路1.2.1 BiLSTM+CRF1.2.2 BERT1.2.3 预训练对比1.3 总结1. 第四名 whoaido(徐恒)1.1 团队简介团队名称:whaido团队成员:卢凌云就职公司:太平洋保险集团最终成绩:三等奖  团队主要成员目前就职于太平洋保险集团,主要从事NLP相关技术的研究及创新项目的孵化,致力于将人工智能技术服务于保险行业。团队研究及应用主要涉及意图识别、文本分类、文本相似度、命名实体识别及知识图谱等

2020-09-23 17:42:37 149 1

原创 达观杯文本智能信息抽取挑战赛 前三名队伍分享

文章目录1. 第一名 tonyxu(徐恒)1.1 最终提交方案概览1.2 整体框架与预处理1.3 单模型实现细节1.3.1 FastText+Glove模型1.3.2 Glove+BigramGlove1.3.3 FlairEmbedding&Elmo1.3.4 Bert Base & Bert Large1.3.5 XLnet Base & XLnet Large1.3.6 融合权重选择1.4 总结1.5 自然语言处理类比赛方法总结1. 第一名 tonyxu(徐恒)1.1 最终

2020-09-23 16:46:15 192 1

原创 matplotlib使用汇总

  画图之前首先要设置画布(figure)对象,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小。# 得到画布对象plt.figure(figsize=(width, height)) # unit is inch(英寸)# 绘制子图,其中index是从1开始计算plt.subplot(nrows, ncols, index, **kwargs) # 将画布分为nrows*ncols个子区域, index表示第N个子区域设置坐标轴的起始和终止值plt.xlim

2020-07-21 15:47:50 173 1

原创 Tensorflow简要介绍

TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性

2020-07-17 16:40:33 144 1

原创 贪心算法和动态规划的区别与联系

1. 联系都是一种推导算法都是分解成子问题来求解,都需要具有最优子结构2. 区别贪心:每一步的最优解一定包含上一步的最优解,上一步之前的最优解则不作保留。动态规划:全局最优解中一定包含某个局部最优解,但不一定包含前一个局部最优解,因此需要记录之前的所有的局部最优解贪心:如果把所有的子问题看成一棵树的话,贪心从根出发,每次向下遍历最优子树即可(通常这个“最优”都是基于当前情况下显而易见的“最优”);这样的话,就不需要知道一个节点的所有子树情况,于是构不成一棵完整的树。动态规划:动

2020-07-08 11:38:13 188 1

原创 使用区间来简化代码思考

  Leetcode中移动零(https://leetcode-cn.com/problems/move-zeroes/)和快速排序的最初版本,本质上都可以使用区间来简化代码。  首先以移动零为例,假设两个循环变量分别为jjj和iii(假设j<=ij<=ij<=i),则[0,...,j][0,...,j][0,...,j]中均为非零元素(区间1),而[j+1,...,i−1][j+1,...,i-1][j+1,...,i−1]均为零(区间2)。其中i是从最开始滑到最后一个元素的。  

2020-07-06 16:40:34 212 1

原创 Leetcode最大和最小子序和

class Solution: def maxSubArray(self, nums: List[int]) -> int: if len(nums) == 0: return 0 global_max = nums[0] step_max = nums[0] if len(nums) == 1: return global_max for i in range

2020-06-09 14:53:37 247 7

原创 代码思路标准流程

  首先引入几个基本概念。fff代表指定的函数。每一步(step)和每一轮(round)。假设为二重循环,则外层循环一次代表走一轮,而内层循环一次代表走一步。如果是一重循环,则循环一次代表走一步。  以冒泡排序为例,假设冒泡排序为函数fff,则表达式即为f(x1,x2,…,xn)f(x_1,x_2,\dots,x_n)f(x1​,x2​,…,xn​)。为了更好的理解复杂的情况,我们先理解最简单的情形:假设只包括单个元素时:f(x1)=x1f(x_1)=x_1f(x1​)=x1​假设元素个数为2个时:

2020-06-09 10:17:12 888 2

原创 Leetcode学习

1. 刷题方法  自顶向下 VS 自底向上。两种方法各有优劣。那怎么才能达到最好的学习效果呢?  入门时使用自底向上的学习方法,以玩游戏为例,了解了基本的游戏规则,然后就先玩起来,在玩的过程中逐渐熟悉。但这样的玩法,必然会在一定阶段遇到瓶颈,问题的本质在哪里,那如何解决呢?  深入时再对对应的章节采用自顶向下的学习方法。比如通过阅读算法的参考书籍,如图解算法、算法(第4版)。1.1 第一遍(第一次梳理思路,可依赖)  自己独立思考,理解题意,明确边界条件。基础薄弱(刷题少于100道)的同学,思考时

2020-06-01 16:47:09 845 5

NIVDIA.csv|NIVDIA.csv

英伟达的股价数据,时间是从1999年到2017年,包含了开盘价、收盘价、最低价、最高价、成交量等信息。

2020-10-13

BvSshServer

利用该软件实现Windows和Linux间的文件互传(scp命令),严重推荐,亲测可用。当然,在使用之前需要进行一定的配置。

2020-05-13

Dism10.1.1001.10.zip

Dism++ 是一款 Windows 系统管理优化工具,它解决了我们安装、维护系统的一大痛点问题——自定义设置和优化。相当于一个 “一站式” 管理优化工具集。亲测节省了10G C盘空间。

2020-05-12

nltk的可用库文件

NLTK为3.3,其中包括punkt.zip、averaged_perceptron_tagger.zip、stopwords.zip,在Centos环境下亲测可用。

2020-05-08

Fashion MNIST数据集

Fashion-MNIST是Zalando(一家德国的时尚科技公司)提供的商品数据集,数据为10种类别,并且包括了6W的训练集和1W的测试集。

2020-04-17

mnist完整数据集

非常基础的数据集,适合深度学习入门,如若使用Tensorflow 2.0对MNIST数据进行分类,可参考https://blog.csdn.net/herosunly/article/details/95758754

2020-04-17

frequency_dictionary.zip

symspellpy是可以进行文本的纠错,也可以将连在一起的字母分割成若干个单词的。根据实践表示该文件还是比较好用的,该文件是它的字典库。

2020-04-14

neo4j-community-3.4.5-unix.tar.gz

Neo4j Linux Community Version(3.4.5),亲测可用。具体学习可参考https://blog.csdn.net/herosunly/article/details/103717440。

2020-01-03

知识图谱相关数据压缩包

贪心学院的知识图谱相关数据压缩包,可通过命令将其导入到Neo4j数据库中,如果需要可以使用积分下载。

2019-12-26

感知机分类数据(线性可分和不可分)

感知机分类数据,包括线性可分数据(15.dat)和线性不可分数据(18.dat)。数据来源为林轩田老师的机器学习基石的作业。

2019-12-16

使用BERT进行新闻分类

使用BERT与TensorFlow Hub进行电影评论的情感分类,内容丰富详实,一共62页,值得深入学习。

2019-12-13

Encoder-Decoder网络上.pptx

Encoder-Decoder的经典模型介绍,尤其讲述了为什么要采用Encoder和Decoder两步结构,而不是直接使用单步模型,以及重点讲述了RNN、LSTM的演进过程。

2019-12-13

winsock2.reg

当QQ出现0x000000c并且打不开网页,可以尝试删除HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\WinSock2,然后导入该文件,重启就可以。

2019-12-10

Tensorflow On Spark.pptx

Tensorflow On Spark库的深入介绍,包括架构、API等内容。内容丰富详尽,值得学习。

2019-12-09

香港中文大学凸优化讲义和作业

香港中文大学凸优化讲义(知乎大神推荐),内容非常详细深入(类似于逐字稿),值得新手和进阶的同学学习。

2019-11-21

long-short-term-memory-networks-with-python

LSTM(长短期记忆网络)的基本概念以及Python实战,值得学习。

2019-07-24

Navicat for MySQL 11.0.10(64bit) + 破解补丁

Navicat for MySQL 11.0.10(64bit)和破解补丁,亲测可用。

2019-06-19

阿里云安全比赛第一名的PPT和代码

阿里云安全比赛第一名的PPT和代码,内容使用,值得学习。

2019-06-19

主会场 王卓然-语义智能:技术探索与产品落地.pdf

语义智能:技术探索与产品落地,内容丰富,值得学习。

2019-06-19

Alexa_top-1m.csv.zip

Alexa排名前一百万的域名的文本文件,内容正确,可以使用。

2019-06-18

目标检测.pdf

计算机视觉中的目标检测的文档,内容详细,值得学习。

2019-06-14

Machine Learning and Security Protecting Systems with Data and Algorithms

18年新书《Machine Learning and Security Protecting Systems with Data and Algorithms》

2019-06-06

Applied Linear Regression

Applied Linear Regression,广义线性回归,值得学习和研究。

2019-06-06

Pattern Recognition and Machine Learning

经典书籍Pattern Recognition and Machine Learning,值得研究学习。

2019-06-06

Web Application Defender's Cookbook Battling Hackers and Protecting

Web Application Defender's Cookbook_ Battling Hackers and Protecting

2019-06-05

情感机器(美)马文·明斯基.zip

情感机器(美)马文·明斯基,内容丰富详实,值得学习研究。

2019-06-05

SQL_Injection_Attacks_A_Systematic_Revie

SQL_Injection_Attacks_A_Systematic_Revie,有关SQL攻击的方法的综述。

2019-06-05

阿里云安全第一名PPT

基于动态沙箱API序列,对不同类型的样本做多分类。其中使用了attention等技术。

2019-06-05

Exploratory Multivariate Analysis by Example Using R

Exploratory Multivariate Analysis by Example Using R,经典教材,值得学习。

2019-06-05

无线网络安全

无线网络安全的相关内容,内容丰富深入,值得学习研究。

2019-06-05

SQL Injection Attacks and Defense-Syngress (2012)

SQL注入攻防的经典英文教材,内容丰富深入,值得学习。

2019-06-05

基于语义的恶意代码行为特征提取及检测方法

基于语义的恶意代码行为特征提取及检测方法,内容丰富,值得学习。

2019-06-05

Statistics, 4th Edition by David Freedman

经典的统计学教材,版本为英文版的。内容丰富,值得学习。

2019-06-05

大数据技术助力金融业务安全

大数据技术助力金融业务安全的文档,内容丰富,值得学习。

2019-06-05

SemEval2010_task8_all_data.rar

SemEval2010 task8的数据集,其中论文《Relation Classification via Convolutional Deep Neural Network》用的就是该数据集。

2019-05-27

jieba分词的自定义词典文档 完整版

jieba分词的自定义词典:使用jieba分词对语料进行分词之前,需要先载入,载入代码为jieba.load_userdict("userdict.txt")。

2019-05-27

Access数据库的64位驱动

微软Access数据库的64位驱动,是使用Python处理MDB文件的前提要件。

2019-05-23

国家名英语缩写和其对应的中文名和完整英文名

国家名英语缩写和其对应的中文名和完整英文名,可通过pd.read_csv读取。

2019-05-23

GeoLiteCity.dat

Python查询IP地址所属的国家和城市的库。使用的时候需要先pip install geoip。 import pygeoip class GeoIP(object): def __init__(self, db="GeoLiteCity.dat"): self.gi = pygeoip.GeoIP(db, pygeoip.MEMORY_CACHE) def region(self, ip): res = {} info = self.gi.record_by_addr(ip) if not info: return res res["country"] = info["country_code"] res["city"] = info["city"] return res

2019-05-23

中国城市拼音和汉语对照表

json文件,key为城市的拼音,value为城市对应的汉语词汇。使用Python语言的接口是: import json with open(r'country.json', encoding = 'utf-8') as json_data: country_dict = json.load(json_data)

2019-05-23

帮忙删除资源

发表于 2019-04-08 最后回复 2019-04-22

空空如也
提示
确定要删除当前文章?
取消 删除