自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 台大week4-笔记

用心努力回顾word2vecGloveWord Vector Evaluationsoftmax与cross entropy一、回顾省略。。。。。。。二、word2vec1、引言word embedding方法,可以从未标记的training corpus构造这其中每个词的vector,来表征其语义,vector的用处:可以计算两个词的相似度可以作为一个包含语义的重要特征不断更新2

2017-12-24 23:46:12 255

原创 台大DL-week2笔记

用心努力反向传播语义表达序列建模一、反向传播1、前情提要神经网络的模型: y=f(x)=σ(WL...σ(W2σ(W1x+b)))y=f(x)=\sigma(W^L...\sigma(W^2\sigma(W^1x+b))) 不同的W,b对应着不同的模型,重新定义模型为f(x,θ)f(x,\theta) θ={W1,b1,W2,b2,...WL,bL}\theta=\{W^1,b^1,W^

2017-12-16 19:13:15 236

原创 台大DL—week1 笔记

用心努力引言神经网络基础一、引言1、ML与DL的区别a) 什么是ML呢?给定一组数据集,ML等效于寻找一个函数,这个函数可以实现预测识别功能。比如,给定一个波形,识别出“你好”,给定一个手写字体图片识别出“2”,给定星期四多云预测出星期六下雨等等。 模型:假设函数的集合(f1,f2,…) ⇒ 训练:挑选最优函数f* ⇒ 预测:测试集 b) 什么是DL呢?是寻找一个更复杂的函数,这个函数是

2017-12-09 16:13:37 311

原创 Scrapy之路第一篇

Scrapy之路第一篇(入门案例) 构建自己的数据王国新建项目明确目标制作爬虫保存数据一、新建项目(scrapy startproject)在爬取前,必须创建一个新的scrapy项目,进入自定义的项目目录中,运行下列命令:scrapy startproject myspider其中,myspider为项目名称,可以看到将会创建一个myspider文件夹,目录结构大致如下: 这些文件

2017-09-28 23:00:53 848

原创 redis之路第一篇

redis之路第一篇 不会一两个数据库怎么行Nosql简介安装与运行基本配置与启动一、Nosql简介NoSQL,全名:Not Only SQL,非关系型的数据库随着访问量的上升,网站的数据库性能出现了问题,于是NoSQL诞生1、优点/缺点优点 高扩展性分布式计算低成本架构的灵活性,半结构化数据没有复杂的关系缺点 没有标准化有限的查询功能(到目前为止)最终一致是不直

2017-09-25 19:41:30 571

原创 mysql之路第四篇

mysql之路第三篇(与python交互) 不会一两个数据库怎么行简介增改删查询封装用户登录一、简介1、安装引入模块安装pymysql模块pip install pymysql安装mysql模块import pymysql2、Connection对象用于建立与数据库的连接创建对象:调用connect()方法conn=connect(参数列表)参数host:连接的mysq

2017-09-21 16:10:14 222

原创 mysql之路第三篇

mysql之路第三篇 不会一两个数据库怎么行关系连接自关联子查询内置函数视图事务总结与小尝试一、关系创建学生表students,结构如下 id学生创建科目表subjects,结构如下 id科目创建成绩表scores,结构如下 id学生科目成绩那么scores学生列的数据应该是从学生表引用过来的,这个对应关系也是一条数据,根据范式要求应该存储的是学生的编号,

2017-09-21 11:33:15 239

原创 mysql之路第二篇

mysql之路第二篇 不会一两个数据库怎么行查询简介去重条件聚合分组排序分页总结与小尝试一、查询简介第一篇中就简单的涉及了查询的一般语法:SELECT * FROM 表名;from关键字跟着表名,表示数据来源于这张表select后面写表中的列名,如果是*表示在结果中显示表中所有列在select后面的列名部分,可以使用as为列起别名,这个别名出现在结果集中如果要查询多个列,

2017-09-17 23:18:26 150

原创 mysql之路第一篇

mysql之路第一篇 不会一两个数据库怎么行数据库基础知识mysql安装管理数据完整性字段类型约束使用命令连接数据库操作表操作数据操作备份与恢复一、数据库基础知识1、基本介绍数据库系统解决的问题:持久化存储,优化读写,保证数据的有效性。当前使用的数据库,主要分为两类:文档型——splite,就是个文件,通过对文件的复制完成数据库的复制;服务型——mysql、postgre

2017-09-15 21:01:33 247

原创 python基础第七篇

python基础 (六)面向对象 真心觉得python这门语言是业界良心:面向对象介绍及优点面向对象特性经典类vs新式类静态方法类方法属性方法类的特殊成员方法反射动态导入模块一、面向对象介绍及优点 面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。

2017-09-15 12:46:41 174

原创 python基础第六篇

python基础 (五)模块篇2 真心觉得python这门语言是业界良心:shelve模块xml处理configparser模块hashlib模块logging模块一、shelve模块shelve模块可以持久化任何pickle可支持的python数据格式,仅通过简单的key-value模式。常规持久化:#将创建好的类、列表、字典、时间戳等持久化#运行后自动创建shelve_bak,s

2017-09-11 11:23:33 196

原创 python基础第五篇

python基础 (五)模块篇1 真心觉得python这门语言是业界良心:json&pickle模块os模块sys模块time&datetime模块random模块shutil模块匿名函数高阶函数内置函数一、json&pickle模块两个模块都用于序列化 - json,用于字符串和python数据类型间的转换 - pickle,用于python特有的数据类型和pytho

2017-09-10 15:19:59 205

原创 Data mining基础之认识数据(2)

python基础 (五) 真心觉得python这门语言是业界良心:json&pickle模块os模块sys模块time&datetime模块random模块递归匿名函数高阶函数内置函数一、json&pickle模块两个模块都用于序列化 - json,用于字符串和python数据类型间的转换 - pickle,用于python特有的数据类型和

2017-08-13 23:40:58 359

原创 python基础第四篇

python基础 (四)真心觉得python这门语言是业界良心:生成器迭代器装饰器一、生成器首先来看一下列表生成式:num_list=[i**2 for i in range(5)]print(num_list)#输出#[0, 1, 4, 9, 16]列表生成式可以让我们很方便的生成一个列表,但是若是创建一个含有100万的元素的列表,其中有些元素经常用,有些元素几百年才用一回,这样就会

2017-08-12 13:04:41 219

原创 python基础第三篇

python基础 (三) 真心觉得python这门语言是业界良心:函数语法与特性局部变量与参数返回值嵌套函数递归匿名函数高阶函数内置函数一、函数语法与特性 函数:将一组语句的集合通过一个函数名封装起来,若想执行该函数,调用其函数名一般语法:def hello(*args,**kwargs): ... return ...参数和返回值视情况而存在特性:

2017-08-10 21:08:07 247

原创 python基础第二篇

python基础 二月红 真心觉得python这门语言是业界良心:列表、元组操作字符串操作字典操作集合操作文件操作字符编码与转码一、列表、元组操作 列表是最常用的数据类型之一,可实现最方便的存储和修改等操作。定义列表:>>> your_name=["xzx","mm","xmm"]通过下标访问:>>> your_name[0] 'xzx'>>> your_name[2]

2017-07-31 17:47:40 795

原创 数据科学家漫漫长征路

python基础 day1 真心觉得python这门语言是业界良心:变量用户输入模块初识.pyc数据类型数据运算if…elsebreak and continuewhile一、变量\字符编码 声明变量#-*-coding:utf-8 -*-name="xmm"声明了一个变量name,值为”xmm”。 变量定义的规则: 变量名只能是字母、数字或下划线的任意组合

2017-07-20 12:55:28 195

原创 Linux -Shell基础

脚本执行方式1.echo 命令echo [选项][输出内容] 选项: – -e:支持反斜线控制的字符转换[root@localhost ~]# echo "sdfh sfdh sfj"sdfh sfdh sfj注意:中间有空格要用双引号 [root@localhost ~]# echo -e "hell\bo"helo\e[1;- 支持改变字体颜色并开启颜色选项 \e[0m - 关闭颜

2016-07-27 23:30:37 233

原创 Linux IP地址配置

1.输入setup 2.Network configuration 3.Device configuration 4.eth0 按自己的本地IP地址分配好。 5.再一路保存退出。 6.service network restart 7.ifconfig 8.输入ifconfig后没有eth0信息的,找不到IP的,可以试试输入 ifup eth0 (就是打开

2016-07-27 08:13:55 167

原创 Numpy 常用函数及读写操作

文件读写(1)txt格式首先创建一个单位矩阵,然后将其写入txt文件(自定义存储路径)import numpy as npa=np.eye(3)np.savetxt('D:/a.text',a)打开建立的txt文件看看 (2)csv格式loadtxt函数可以方便地读取CSV文件,自动切分字段,并将数据载入NumPy数组。下面都以苹果公司的历史股价数据为例展开 第一列:股票代码以标识股票 第

2016-07-22 19:43:04 773

原创 Numpy 索引切片及reshape方法小结

**用表格的形式比较直观** 先创建一个简单的arrayb = arange(24).reshape(2,3,4)三维坐标对应:楼层,行号,列号 方法 说明 结果 b.shape 获取维度/也可赋值 (2, 3, 4) b[0,0,0] 获取一个元素 0 b[:,0,0] 获取所有楼的第一个元素 array([ 0, 12]) b[0,…] 获

2016-07-21 11:49:17 521

原创 《web scraping with python》笔记--穿越网页表单与登录窗口进行采集

爬取数据时常常会遇到登录界面,这时我们该怎么做来完善自己的爬虫1.学会提交一个基本的表单(1)首先观摩一下最基础的登录界面的html形式:http://pythonscraping.com/pages/files/form.html       <formmethod="post"action="processing.php">First name:

2016-07-19 20:30:19 680

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除