- 博客(12)
- 收藏
- 关注
原创 R语言-matrix生成矩阵
主要介绍一下利用matrix函数和rep生成矩阵在R语言中可以使用matrix()函数来创建矩阵,其语法格式如下:matrix(data=NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)参数含义如下:data:矩阵的元素,默认为NA,即未给出元素值的话,各项为NAnrow:矩阵的行数,默认为1;ncol:矩阵的列...
2018-11-22 13:09:16 34473
转载 python爬虫——网易云音乐
最近爬虫搞得头很大,主要是自己太菜,对付网易云音乐实在搞不定,网易云的部分内容使用api传输,靠大神的指导终于完成了,话不多说大神的代码送上#python3# -*- coding: utf-8 -*-# File : spider1.py# Author: Wang Chao# Date : 2018/11/5import requestsimport jsonfrom ...
2018-11-06 01:54:42 982
原创 pyhong爬虫——大众点评——用户信息
1.前一部分依旧没有变化,不过用户的链接从哪来呢,从上一期的商户评论里拿到了用户个人主页的链接,建了一个csv文件,从而用作这次爬虫的链接库。 from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDrive...
2018-10-31 01:55:08 1949
原创 python读取数据
1.读取文件夹下的所有数据import osimport pandas as pd #文件夹路径path = ''#读取文件夹下文件名files = os.listdir(path)data_list = []for file in files : x = pd.read_csv(file) data_list.append(x)#合成一个dataframe...
2018-10-29 01:21:17 1173
原创 python爬虫——大众点评——商户评论
### 今年大众点评已经可以识别selenium,使用这个就会被封,建议大家另寻其他方法### 貌似是有一些编译过的webdriver,可以把请求里代表测试工具的关键字拿出来抓取内容:大众点评-北京-海淀区-美食商户-近三个月内的评论需要的配置:chrome浏览器,python的selenium包,selenium 启动selenium,执行下面代码,之后可以看到一个新的chrome...
2018-10-28 17:07:39 4313 2
原创 python爬虫技术
首先感谢陈堰平老师这几天辛苦的教学,不管是助教还是学员,在您的课堂上都收获良多!!我借助陈老师总结的思维导图展开介绍一下爬虫 首先要明确一点,爬虫是从网站中提取到我们需要的数据,而网站是程程序员写的,每个网站的使用的语言、每个人代码的习惯、每个数据在网站中的位置肯定不会是一模一样的,我们需要根据网站的情况不断更改我们的爬虫一、网页基础简单说一下静态网页和动态网页对于爬虫的区别,...
2018-08-03 22:11:45 463
原创 应用计量经济学
听了天津财经大学高华川老师的一堂课,发现很多问题,确实是学习过程中很容易忽视的却很重要的问题,所以大致总结一下。 1.计量经济学做的回归模型,回归方程的系数表示的是因果关系还是相关关系? 首先要肯定的是,回归方程表示的必然是相关关系,但是当有理论支撑,说明X与Y存在因果关系的时候,系数才可能表示因果关系,因果关系必然相关,但是相关却不一定有因果,比如下面这个例子, ...
2018-07-12 23:37:46 2735
原创 CS231斯坦福深度视觉学习课程学习笔记——第3章 梯度下降算法
之前有人问过我算法是什么?当时有点懵,但还是想到了这两个例子,应该是我们最常用的吧。简单来说,算法就是我们解题的方法,比如我们要估计π值,有人用浦丰投针,有人用圆的周长,有人用蒙特卡洛模拟,虽然过程不同,但是我们的目的一样。下面我介绍一下我了解的两种常用的算法:蒙特卡洛模拟,梯度下降法。在神经网络中,我们定义了损失函数,模型训练的过程,就是损失函数最小化的过程,就是求得使损失函数取最小值的各个参数...
2018-07-11 23:30:27 192
原创 CS231斯坦福深度视觉学习课程学习笔记——第3章
不得不说,这一章虽然讲的不多,但是有很多公式和对公式的理解,我理解的也不是很透彻,再后面的学习中,我会把自己的理解加回来。1.上次提到的Linear分类器的输入变量x是列向量,和图片的数字矩阵不同,怎么理解?确实我上次听的时候也有这个疑惑,但是在今天找到了答案,Linear的输入变量并不是数字矩阵本身,而是加工处理过的变量,对于图片的特征,由很多的提取方法:最原始的有颜色直方图法,计算机表示图片的...
2018-07-03 00:02:13 186
原创 CS231斯坦福深度视觉学习课程学习笔记——1~2章
1.计算机视觉的理解:如果阿尔法狗的围棋实力,让你觉的计算机已经全方位的超越了人类,那么在视觉识别上你可以树立自信了,毕竟目前来看,没有任何一个机器的视觉能力能够达到甚至超越人类的水平,同样的一张图片,在我们眼中是各式各样的信息,但是在计算力的眼里,只是一堆数字矩阵。说到视觉,不得不讲一讲计算机形成图片的方法,每张计算机图片都有自己的像素,像素是形成图片的小方格,比如一张600x800的像素图片,...
2018-07-01 21:51:57 322 1
原创 数据的划分——训练集,验证集,测试集
1.为什么要对数据进行划分,越多的数据训练的模型不是越好吗? 的确,模型的性能和训练数据的多少有很大关系,我们先看看这三个集合的用处训练集(training set) 训练集的作用就是训练模型,形成模型的内部结构和参数估计,比如古典的线性回归模型,每个变量前边的参数都是由训练集估计出来的,这里我们要区分一个概念,参数和超参数: ...
2018-06-29 23:39:19 16899 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人