自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (2)
  • 收藏
  • 关注

原创 Pytorch学习笔记(八)----经典卷积神经网络alexnet学习与CIFAR10数据集初探

序言从本节起,将正式走入深度神经网络的大门。关于什么是alexnet、什么是cifar10自行百度。在学习卷积神经网络前,得明白什么是卷积、什么是池化。详细的解释见基础理论中提供的pdf文档。本节主要是使用cifar10数据集对alexnet进行训练,提高对测试集的检测成功率。基础理论https://pan.baidu.com/s/1yv5VIYLjoOPFEwuw1Abw2g详细代码i...

2020-01-16 09:38:20 708

原创 Pytorch学习笔记(七)----多层神经网络预测房价(回归模型)+GPU的使用

序言上一节学习了使用多层神经网络进行多分类问题的研究,这次我们使用多层神经网络进行回归问题的探索。同时学会如何在pytorch上使用GPU进行计算。本次的数据集不像上一节直接从网上下载就可以使用的标准数据集,模拟“自己采集的数据集”进行预处理,再进行训练。基础理论本节没有过多理论,只提一点,想使用GPU进行计算,只需要再输入的tensor与模型上加上‘.cuda()’就行,但想把计算结果转n...

2020-01-09 19:58:07 10763 11

原创 Pytorch学习笔记(六)----多分类问题与MINIST数据集初探

序言学习的内容逐渐深入,务必一步一脚印,否则后面的看不懂哈。本节学习内容,主要学习了多分类问题的求解方法,初步学习了图像识别问题。熟悉了著名的MINIST数据集。基础理论https://pan.baidu.com/s/1jMu-FZlTu6GDdy6fYN-5Kg主要介绍了MINIST数据集,SOFTMAX函数以及loss函数交叉熵。这些都是循序渐进的,如果想稍微了解一些原理,务必学习前面...

2020-01-03 11:15:32 544

原创 Pytorch学习笔记(五)----多层神经网络

序言本次设计一个简单的三层神经网络模型。上一章学习了一个线性的分类模型。但如果数据集无法用一条线、一个面进行分类呢?此时神经网络就有用武之地了。但是本次实验还是用的上次的数据集,有效果就行~原理与数据集https://pan.baidu.com/s/1kkZl3Shj6D5djmx0H8ifqw为什么要标准化,有哪些标准化的方法,详细自行百度。本实验采用常用的简单标准化方法min-max。...

2019-12-27 10:06:36 445

原创 Pytorch学习笔记(四)----logistic模型

序言上一章学习了一个线性回归模型,这次我们了解一下一个简单的分类模型logistic。其实就是在线性模型外加了一个sigmod函数。具体原理pdf与本次实验用数据见网盘。原理与数据https://pan.baidu.com/s/1FoV6V7n0ljBHLB5jF-FBeQ数据样例:34.62365962451697,78.0246928153624,030.2867107682260...

2019-12-26 13:54:23 478

原创 Pytorch学习笔记(三)----线性模型与梯度下降

序言笔记(二)只是给一个大致映像,步子跨的比较大。现在,一步步,扎实的记录分享学习过程。主要记录代码,详细的原理自行百度。详细代码import torchimport numpy as npimport matplotlib.pyplot as plt#一个简单的线性例子#参数点x_train = np.array([[3.3], [4.4], [5.5], [6.71], [6...

2019-12-24 14:49:29 218

原创 Pytorch学习笔记(一)----安装Pytorch

Pytorch学习笔记(一)----安装Pytorch说明:默认已安装好Anaconda3与CUDA。因之前有用python研究过爬虫与tensorflow,所以这两个电脑里有。1、确认CUDA版本打开NVIDIA控制面板,选择帮助中的系统信息,点击组件。确认CUDA的版本。如图所示我的是9.2。如果电脑没有gpu,则忽略此步。2、生成安装命令打开Pytorch官网。按照自己系统的...

2019-11-27 16:14:43 781

原创 python爬虫练习五(补充): 2018年统计用区划代码和城乡划分代码(附代码与全部数据)

之前爬取过2017年的数据 详见Python爬虫练习五:爬取 2017年统计用区划代码和城乡划分代码(附代码与全部数据),下面有评论说广东省的数据缺少了东莞与中山两个市的数据,检查网页结构发现确实是代码没考虑到,这两个市没有区级,直接到街道、办事处级了。考虑到代码的复用性、以及唯独此两个市的特殊性,(其实是懒),在源码不变的情况下,添加以下代码处理此两市的数据。在Spiders.py ...

2019-03-19 16:26:03 1216 3

原创 Python爬虫:验证码识别

有段日子没写博客了,工作略忙~(这是借口)回归正题,验证码是爬虫永远绕不过去的坎。无论你是常规爬取还是用selenium+无头浏览器进行用户的登陆操作,都需要识别验证码。为了搞验证码,搞得对图像也有了初步的了解,不废话说结论。安装:环境:win10,anaconda3 ,python3.61、开源OCR tesseract 下载网址https://digi.bib.uni-ma...

2019-03-13 20:41:14 426

原创 Python爬虫练习五:爬取 2017年统计用区划代码和城乡划分代码(附代码与全部数据)

  本文仅供学习,需要数据的文末有链接下载,请不要重复爬取。  最近工作中,因为统计用区划代码和城乡划分代码更新了最新的2017版,需要爬取最新的数据。于是乎,本次花了一定精力,将整个2017版数据完完整整的爬了下来。相较于第一次爬虫练习的2016版,本次改进很多,主要特点如下。  1、通过尝试爬取目标网址,发现相较于以往,竟然设置了反爬虫手段,在进行get请求的时候需要增加header...

2018-08-01 22:29:30 5184 6

原创 Python爬虫练习四:利用selenium爬取煎蛋网的妹子图

    目标网址:http://jandan.net/ooxx。    经研究发现,煎蛋网设置了大量的反爬虫机制(果然妹子是第一生产力,网站被爬的痛了),隐藏了图片地址,搞了半天没找出规律。心一横,采取曲线路线,成功爬取大量妹子图~    selenium可以模仿人操作浏览器,从而达到通过与浏览器交互的方式,使服务器上的反爬虫机制失效。但这种方式也有其缺点:1、必须要打开浏览器,程序模拟人对浏览器...

2018-06-05 09:45:30 902

原创 Python爬虫练习三:爬取豆瓣电影分类排行榜 - 动作片top10%(动态加载网页的抓取)

    目标网址url:    https://movie.douban.com/typerank?type_name=%E5%8A%A8%E4%BD%9C&type=5&interval_id=100:90&action=    使用谷歌浏览器的检查功能对网站进行分析,发现需要爬取的内容在class‘movie-list-item playable unwatched’下...

2018-05-30 19:54:55 8745 3

原创 Python爬虫练习二:爬取笔趣阁小说

爬取这个小说网站真的很EASY!很有成就感~适合爬虫的初学者!以一个叫《凡人修仙传仙剑篇》的小说作为目标进行爬取测试。废话不多说,上代码!import requestsfrom bs4 import BeautifulSoupaimurl="http://www.biquge.com.tw/18_18998/"#爬虫目标网址url="http://www.biquge.com.tw"#hre...

2018-05-29 20:56:46 3498 2

原创 Python爬虫练习一:爬取 2016年统计用区划代码和城乡划分代码

    目标网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2016/index.html    爬取所有市级的统计用区划代码和区级、县级的url(即目标网页第二层链接的内容全部爬取),区级、县级及以下的区划代码没有爬取。    网站构造比较简单,容易爬取成功。import requestsfrom bs4 import Beautiful...

2018-05-29 16:27:55 2678

原创 编程实现字符串的循环右移

例题:输入一个字符串和一个整数,输出右移后的字符串。例如输入字符串str=“1234567”, 整型n=3,输出字符串str=“5671234”。思想:step1.生成一个辅助数组temp[n]存放要前移的部分“567”。         step2.将没有前移的部分从后向前依次向后移动。str变成“1231234”。          step3.将辅助数组中的字符覆盖str前n位。str变成“...

2018-03-19 14:20:32 1193

原创 编程实现字符串中各单词的翻转

例题:将“i am from shanghai”=>"shanghai from am i".思想:翻转分为两部,第一部将整个字符串全部翻转变成“iahgnahs ....”,然后依据空格,再将每个单词翻转变成“shanghai ...”.这两个步骤可以调换,即先单词翻转,在整个字符串翻转。另外C++有reverse函数。void reverse(char* str){ asser...

2018-03-18 15:05:17 935

原创 大数加减法法思想

当运算的俩个数超过了int、float、double的时候,该如何运算呢?简单例题:两个正整数,无限大,输出两个数相加的结果。思想:表示无限大的数,只有使用字符串来表示了,所以使用字符串来模拟计算过程是大数处理的过程。#include <iostream>#include<stdlib.h>#include<string.h>using namespace...

2018-03-17 11:45:16 603

原创 对实参与形参之间数据传输的一些理解(指针指向、存储位置)

首先我们先通过一题来了解一下实参与形参间值传递的方式。例题1:void Getmemory(char *p){ p=(char *)malloc(100);}int main(){ char *str=NULL; Getmemory(str); strcpy(str,"hello!"); cout<<str<<endl;}...

2018-03-16 11:12:33 999

原创 Next数组的实现步骤与代码,以及三个简单应用(包含KMP)

        简单介绍一下什么是next数组,毕竟网上有很多懂意思就行,本文的重点在代码解释与三个简单面试例题上。next数组就是记录str中每个位置前缀与后缀的匹配长度(不包含该位置自身)。例如:str="ababac",那么它的next数组就是[-1,0,0,1,2,3];第3个字符‘b’的前缀是‘a’,后缀也是‘a’,长度为1,则next[3]=1。最后一个字符‘c’的前缀就是‘aba’,...

2018-03-01 00:13:31 4304

原创 单向链表各种功能代码详解

      线性表的链式存储表示的特点是用一组任意的存储单元存储线性表的数据元素(这组存储单元可以是连续的,也可以是不连续的)。因此,为了表示每个数据元素 与其直接后继数据元素 之间的逻辑关系,对数据元素 来说,除了存储其本身的信息之外,还需存储一个指示其直接后继的信息(即直接后继的存储位置)。由这两部分信息组成一个"结点"(如概述旁的图所示),表示线性表中一个数据元素。线性表的链式存储表示,有一...

2018-02-09 16:22:35 1631

原创 堆排序简单介绍与代码详解

堆排序的图文过程网上很多,不再赘述。简单介绍一下堆排序,方便日后拾起再看。堆是顺序存储的完全二叉树。大根堆的要求是每个节点的值都不大于其父节点的值,即a[parent] >= a[child]。在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的要求可知,最大的值一定在堆顶。细节:1、堆中,A[i]的左节点为A[2i+1],右节点为A[2i+2],父节点为A[i/2]。2、N个数的数...

2018-02-08 14:48:27 255

原创 快速排序

我想快排是面试问的最多的排序方式了吧,人生第一篇博客献给快排。写博客仅仅是为了记录自己的学习历程,与程序猿生活,就酱~以下概念抄自百度百科。设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。值得注意的是,快速排序不是一种稳定的排序算法,也就是说,多个相同的值的...

2018-02-07 20:57:05 147

2018年统计用区划代码和城乡划分代码(截止2018年10月31日)

2018年统计用区划代码和城乡划分代码(截止2018年10月31日) 分为31个省del 格式。 统计用区划代码 名称 城乡分类代码 "110100000000","市辖区","0" "110101000000","东城区","0" "110102000000","西城区","0" "110105000000","朝阳区","0" "110106000000","丰台区","0" "110107000000","石景山区","0" "110108000000","海淀区","0" "110109000000","门头沟区","0"

2019-03-19

2017年统计用区划代码和城乡划分代码(截止2017年10月31日)

爬取的 2017年统计用区划代码和城乡划分代码(截止2017年10月31日)

2018-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除