自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

No.96

学习的一些记录,忘记了的时候再回来看看

  • 博客(149)
  • 资源 (2)
  • 收藏
  • 关注

原创 KDD99CupDataSet-SVM

KDD99CupDataSet-SVMclean data ,feature selection , svm based kdd99数据清洗数据集来源:KDD99入侵检测数据集 http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html筛选出发生在TCP层的Dos流量和normal流量 get_train_data.py 其中Dos流量的标签'

2018-04-12 14:04:48 2966 2

原创 Python 格式化输出整理

字符串格式化输出format方式 格式[[fill]align][sign][#][0][width][,][.precision][type] 参数fill 【可选】空白处填充的字符align 【可选】对齐方式(需配合width使用) <,内容左对齐>,内容右对齐(默认)=,内容右对齐,将符号放置在填充字符的左侧,且只对数字类型有效。 即使:符号+填充物+数字^内容居中sig

2018-03-02 16:33:07 2200

原创 Win10+Android+夜神安卓模拟器 搭建ReactNative开发环境

前言 网上的教程皮的简直不谈了,非要搞个AndroidStdio,你以为呢?反手就是一重锤,我就是不装,第一开发的很多工作都不需要这个IDE,第二运行起来还很吃内存,经过实践有如下的教程,请大家指教。安装git不说了,我相信你早就安装了Java8 需要配置环境变量JAVA_HOME,CLASS_PATH和path路径,配置方式如下 JAVA_HOME => C:\java

2018-02-05 21:09:04 2817

原创 【爬虫工具】下载博客转成Markdown的形式

简单的爬虫工具 下载博客,并转成Markdown的形式为什么要写这个工具 主要是为了收集好的网上资源,每次看到一篇好的文章就像保存下来,但是保存网页的可读性太差了,如果转换成Markdown的形式就很舒服。但是网页中会有许多无聊的标签干扰,于是写个简单的工具使用的python库beautifulsoup4requestshtml2text目录csdn.py csdn博客爬虫j

2018-01-28 15:04:30 1292

原创 爬虫第一步,网络信息采集

自己爬虫经验总结 项目地址网络信息采集在编写爬虫之前可能需要先了解和搜集网站信息robots.txt Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。一般的网站都会有这个文件。可以大致了解这个网站存在哪些限制下面是知乎的robots.tx

2018-01-25 20:32:46 2482 2

原创 拉勾网数据爬取

拉勾网数据爬取爬取内容北京数据挖掘方向的岗位数据方案正常的https://www.lagou.com/jobs/list_数据挖掘?px=new&city=上海#order上面的URL是查询上海数据挖掘岗位的信息并按照最新发布排序 通过抓包分析请求的真正URL是这个https://www.lagou.com/jobs/positionAjax.json

2018-01-22 22:14:24 7913 4

原创 Dijkstra算法Python实现

Dijkstra算法迪杰斯特拉算法是由荷兰计算机科学家狄克斯特拉于1959 年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题。迪杰斯特拉算法主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。算法"""输入graph 输入的图src 原点返回dis 记录源点到其他点的最短距离path 路径"""import j

2018-01-04 19:11:42 3179 1

原创 解释性语言和编译性语言

解释性语言和编译性语言的定义: 计算机不能直接理解高级语言,只能直接理解机器语言,所以必须要把高级语言翻译成机器语言,计算机才能执行高级语言编写的程序。 翻译的方式有两种,一个是编译,一个是解释。两种方式只是翻译的时间不同。解释性语言的定义: 解释性语言的程序不需要编译,在运行程序的时候才翻译,每个语句都是执行的时候才翻译。这样解释性语言每执行一次就需要逐行翻译一次,效率比较低。 现代

2018-01-04 12:35:08 1375

原创 Ubuntu 16.04源码安装最新版Mininet

Mininet 是一个轻量级软件定义网络和测试平台;它采用轻量级的虚拟化技术使一个单一的系统看起来像一个完整的网络运行相关的内核系统和用户代码,也可简单理解为 SDN 网络系统中的一种基于进程虚拟化平台,它支持 OpenFlow、OpenvSwith 等各种协议,Mininet 也可以模拟一个完整的网络主机、链接和交换机在同一台计算机上且有助于互动开发、测试和演示,尤其是那些使用 OpenFlow

2018-01-03 16:26:39 1194

原创 配置安卓SDK

下载Android SDK国内下载地址:http://www.androiddevtools.cn/配置镜像源http://mirrors.neusoft.edu.cn/more.we#android 配置步骤 启动 Android SDK Manager ,打开主界面,依次选择「Tools」、「Options…」,弹出『Android SDK Manager - Settings』窗口; 在

2018-01-03 10:26:39 1399

原创 计算机操作系统——程序执行的流程

一个简单的例子描述,程序从执行到结束操作系统都做了什么#include <stdio.h>int main(){ printf("hello world");}操作系统 * 用户告诉操作系统执行hello程序 * 操作系统到硬盘找到该程序 * 由编译程序将用户源程序编译成若干个目标模块 * 由链接程序将目标模块和相应的库函数链接成装入模块 * 操作系统分配内存,由装入程序将

2017-12-27 16:05:07 7827 1

原创 BFS&Python

# 邻接矩阵graph = [ [0,1,1,0,0,0,0,0], [1,0,1,1,1,0,0,0], [1,1,0,0,1,0,1,1], [0,1,0,0,0,0,0,0], [0,1,1,0,0,1,0,0], [0,0,0,0,1,0,0,0], [0,0,1,0,0,0,0,0], [0,0,1,0,0,0,0,0]]

2017-12-24 14:41:07 1375

原创 MySQL插入json问题

在MySQL5.7.8之后开始支持一种可高效获取JSON文本中数据的原生JSON类型,该类型具有以下优点:存储时自动验证,验证不通过将报错更好的存储结构。采用一种针对告诉读取JSON文本元素的内部结构进行存储。新的服务器是以二进制的格式读取一个JSON文本,而不是以字符串格式读取然后进行转换。这种二进制格式允许服务器在文本中通过键或者数组索引获取其子对象(嵌套数组)而不需要读取全部值另外,系统

2017-12-23 11:01:11 12769

原创 Ubuntu安裝Node.js

安裝node.js8.x版本curl -sL https://deb.nodesource.com/setup_8.x | sudo -E bash -sudo apt-get install -y nodejs安裝node.js9.x版本curl -sL https://deb.nodesource.com/setup_9.x | sudo -E bash -sudo apt-get inst

2017-12-20 12:12:55 216

原创 Python3.6使用tesseract-ocr的正确姿势

环境Python 3.6.3pip 9.0.1tesseract-ocr-setup-3.05.00dev.exeWindows10安装1.tesseract-orc Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。安装的时候需要自行选择安装的语言,一些其他国家的语言

2017-12-17 13:59:45 37370 3

原创 pymongo

环境描述Python 3.6.3pip 9.0.1Windows 10安装pip install pymongo与数据库建立连接from pymongo import MongoClient # 导入包user = "root" # 连接的用户名password = "123456" # 密码host = "localhost" # 连接的数据库主机uri = "mongodb://

2017-12-14 16:15:41 409

原创 windows&mongodb

下载&安装从官网下载 https://www.mongodb.com/download-center#community将MongoDB添加到系统路径我的电脑->属性->更改设置->高级->环境变量->path在path中添加 C:\Program Files\MongoDB\Server\3.6\bin 你的安装路径将MongoDB注册成Windows的一个服务 创建配置文件我在目录C:

2017-12-13 21:46:55 214

原创 No matching distribution found for win32api

Python是没有自带访问windows系统API的库的,需要下载。库的名称叫pywin32,可以从网上直接下载。 以下链接地址可以下载:http://sourceforge.net/projects/pywin32/files%2Fpywin32/ (下载适合你的Python版本)

2017-11-30 23:00:22 7838

原创 调用百度API实现简单的文字识别

偷懒是学习的动力。最近上的课程多数是英文的材料,而且还是图片,对于我这种英语恐惧症的人而言就是噩梦,unfriendly!!!!于是发现了百度的api–OCR具体细节请看API文档:http://ai.baidu.com/docs#/OCR-API/top第一步获取access_token首先需要进行百度开发者认证,然后创建一个文字识别的应用 import requestsimport ssl

2017-11-30 20:20:55 28599 3

原创 Windows上安装Scrapy

Scrapy文档Scrapy Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬

2017-11-25 22:11:58 417

原创 KD树算法

与传统的KNN算法比较我感觉慢很多,我的姿势是不是不对kd树import numpy as npfrom numpy import *class KDNode(): """ KDNode point:该节点的样本点 split:用于判断分割的维度(属性) left:左节点 right:右节点 """ def __init__(self

2017-11-23 23:01:24 560

原创 豆瓣影评数据抓取

抓取豆瓣影评评分正常的抓取分析请求的urlhttps://movie.douban.com/subject/26322642/comments?start=20&limit=20&sort=new_score&status=P&percent_type=里面有用的也就是start和limit参数,我尝试过修改limit参数,但是没有效果,可以认为是默认的 start参数是用来设置从第几条数据开

2017-11-22 20:02:36 10079 5

原创 数据拟合

题目地址:http://www.qlcoder.com/task/763b"""有一个1000行的文本文件,文件的每一行有2个浮点数,代表一个点的坐标(x,y)。(所有点都在第一象限)请找出一条直线 Y=a*X+b,使文件中所有点和该直线的距离的和最短。保留两位小数思路:f(x) = mx + k;需要注意的地方,迭代的次数和学习速率的设置"""import numpy as npimpor

2017-11-19 22:11:24 285

原创 requests库的基础使用

项目地址https://github.com/No-96/FengSpider"""requests的基础用法"""import requestsurl_ip = 'http://httpbin.org/ip'url_github = "https://github.com/timeline.json"url_headers = 'http://httpbin.org/headers'u

2017-11-18 08:52:29 216

原创 mips-simulator

mips-simulator 项目地址:https://github.com/No-96/mips-simulator任务描述1.载入一个MIPS文件,生成与输入文件等效的汇编代码2.通过指令模拟MIPS代码生成指令。它还应该在执行每个指令后生成/打印寄存器和数据存储器的内容。请参见示例模拟输出文件。sample.txt:输入文件simulation.txt:寄存器和数据存储器的内容变化

2017-11-07 19:21:51 2238

原创 K-近邻算法

K-近邻算法采用测量不同特征值之间的距离的方法进行分类优点:精度高,对异常值不敏感,无数据输入假定缺点:计算复杂度高,空间复杂度高适用范围:数值型和标称型算法执行描述: 对未知类别属性的数据集中的每个点执行以下操作 1.计算一致类别数据集中的点与当前点之间的距离 2.按距离递增次序排序 3.选取与当前点距离最小的K个点 4.确定前K个点出现频率最高的类别作为当前点

2017-11-05 11:33:12 221

原创 vscode前端开发简单配置

目前配置也就这么多,有的vscode已经集成就没有列出来View In Browser Extension for vscode to view a html file in a browser. 让HTML页面在浏览器中打开,默认情况下是在系统默认的浏览器中打开 在用户设置中配置成在Chrome浏览器打开"view-in-browser.customBrowser": "chrome"添

2017-10-28 09:26:50 5047 1

转载 Python 爬虫资源包整理

项目地址:https://github.com/No-96/FengSpiderPython 爬虫资源包整理网络通用urllib -网络库(stdlib)。requests -网络库。grab – 网络库(基于pycurl)。pycurl – 网络库(绑定libcurl)。urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。httplib2 – 网络库。

2017-10-23 20:25:47 896

原创 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http:/

在安装wordloud的时候出现这个错误 error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools根据网址链接点进去之后发现需要下载安装一个vs,那不

2017-10-18 20:02:31 12045 3

原创 京东手机图片爬取

环境:Python3.6 + BeautfulSoup4 爬取目标:京东手机图片https://list.jd.com/list.html?cat=9987,653,655思路首先打开目标网页https://list.jd.com/list.html?cat=9987,653,655 查看网页获取发送的GET请求的特征,对比第二页的URL https://list.jd.com/list.h

2017-10-13 17:15:23 1840

原创 UnicodeEncodeError: 'latin-1' codec can't encode characters in position 44-46: ordinal not in range(

UnicodeEncodeError: ‘latin-1’ codec can’t encode characters in position 44-46: ordinal not in range(256)python连接MySQL的时候我也是日狗了,出现了这个错误。网上好多说什么,需要改字符集,资质愚钝不知道他们在说什么,尝试之后还是不行,最后上Stack Overflow解决pymysql.

2017-10-12 20:46:44 4164

转载 堆排序 Python实现(转)

堆排序堆排序是一种树形选择排序,是对直接选择排序的有效改进。 基本思想: 堆的定义如下:具有n个元素的序列(k1,k2,…,kn),当且仅当满足 [图片上传中。。。(1)]时称之为堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最小项(小顶堆)。若以一维数组存储一个堆,则堆对应一棵完全二叉树,且所有非叶结点的值均不大于(或不小于)其子女的值,根结点(堆顶元素)的值是最小(或最大)的。如:

2017-09-28 22:36:19 269

原创 二元选择排序

二元选择排序 简单选择排序,每趟循环只能确定一个元素排序后的定位。我们可以考虑改进为每趟循环确定两个元素(当前趟最大和最小记录)的位置,从而减少排序所需的循环次数。改进后对n个数据进行排序,最多只需进行[n/2]趟循环即可 就是每次从剩下的值中选出最大值和最小值,然后分别放在前面和后面#include<stdio.h>#include<iostream>using namespace

2017-09-28 20:44:35 402

原创 简单选择排序 C++

简单选择排序基本思想循环n次。每次循环找出第i项以后的数中最小的数,与第i项进行交换每次循环开始时前i项时排好序的在要排序的一组数中,选出最小(或者最大)的一个数与第1个位置的数交换;然后在剩下的数当中再找最小(或者最大)的与第2个位置的数交换,依次类推,直到第n-1个元素(倒数第二个数)和第n个元素(最后一个数)比较为止。/*简单选择排序*/#include<stdio.h>#in

2017-09-28 20:14:27 658

原创 希尔排序 Python实现

插入排序—希尔排序(Shell Sort)基本思想先将序列分成较多个子序列分别进行排序,再分成较少个子序列分别进行排序,直到最后为一个序列排序希尔排序采用每隔固定距离选取一个数的方法划分子序。其中间隔距离称为增量例如:增量为3的时候,褐色为一个子序列,黄色为一个子序列,灰色为一个子序列 每个子序列之间采用插入排序算法"""希尔排序"""def shell_insert_sort(a,d

2017-09-28 18:32:40 1378

原创 直接插入排序 Python实现

直接插入排序(Straight Insertion Sort)基本思想往已有的有序序列中插入需要排序的值已排序完毕的数列是有序的将第一个元素看做一个有序的序列,从第二个元素开始一直往前插入排序每次插入得到元素个数加1的新序列如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,保证插入排序是稳

2017-09-28 15:58:11 1045

原创 时间复杂度从O(n^3)到O(n^2)的优化

题目描述 给定由n个整数A[0],A[1],A[2],A[3],….A[n-1]组成的数组A。你想输出一个二维的n*n的数组B, 其中数组B[i,j] (i第一种解法思路For i =0,1,2,...n-2 For j = i+1,i+2,....n-1 将A[i]->A[j]的累加和赋值给B[i,j]由于要满足j>i,这样来说二维矩阵的对角线是不需要进行计算的,

2017-09-25 21:20:29 2518

原创 单身狗脱单算法 脱单了算你赢

问题背景需要考虑的问题算法描述 比较懒,怎么记录方便我就怎么来了,于是随手粘贴了图片数据结构1.将男士和女士对异性好感的排序表抽象成一个二维数组MP和WP 2.创建两个数组用来记录男士和女士是否单身,其中索引表示第几位男士,存储的值表示是否脱单。例如:isManFree[0] = True # 表示第0位男士还是单身3.设计男士对女士的追求表,记录男士有没有追过这位女士,二维表中女士表示横轴

2017-09-21 22:28:24 693

原创 Django Temples中的注意点

模板一般放在app下的templates中,Django会自动去这个文件夹中找。但 假如我们每个app的templates中都有一个 index.html,当我们在views.py中使用的时候,直接写一个 render(request, ‘index.html’),Django 能不能找到当前 app 的 templates 文件夹中的 index.html 文件夹呢?(答案是不一定能,有可能找错)

2017-09-20 21:00:04 468

原创 Django&templates

模板使用的基本步骤如下准备工作想要使用Django的模板功能,首先需要将创建的app注册到settings.py的INSTALLED_APPS中INSTALLED_APPS = (## 自带的 'django.contrib.admin', 'django.contrib.auth', 'django.contrib.contenttypes', 'django.c

2017-09-20 20:56:12 357

Cocos2d-JS游戏开发

用原生JavaScript开发手机游戏,适合具有一定JavaScript基础并想快速开发手机游戏的开发人员

2017-07-08

VC中使用的OpenGL库(glut.h)

在vc中使用OpenGL绘图的时候需要用到的类库。使用方法,解压缩之后将里面的.h文件复制到vc6.0对应的include目录,将lib文件放到对应的lib目录,将dll文件放到Windows下的system32文件夹中

2016-09-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除