2018年07月_zhuzuwei

原创 Java关键字

一、关键字总览访问控制private protected public类,方法和变量修饰符abstract class extends final implements interface native newstatic strictfp synchronized transient volati...

2018-07-27 12:32:31 136

转载 Java运算符及运算符优先级详解：包括 i=i++的结果

一、算术运算符符描述例子 + 加法 - 相加运算符两侧的值 A + B 等于 30 - 减法 - 左操作数减去右操作数 A – B 等于 -10 * 乘法 - 相乘操作符两侧的值 A * B等于200 / 除法 - 左操作数除以右操作数 B / A等于2 ％取余 - 左操作数除以右操作数的余数 B...

2018-07-27 09:12:07 8419 2

原创 Java基本数据类型详解

Java中的基本数据类型1. 整数型类型大小范围示例 byte 占一个字节 -128~127 byte b = 10; short 占两个字节 -2^15~2^15-1 short s = 20; int 占四个字节 -2^31~2^31-1 int i = 30; long 占八个字节 ...

2018-07-27 09:02:32 391

原创 Eclipse 查看源代码Source not found

1. Eclipse 快捷键 ctrl + 鼠标左键可以查看Java 类/函数的源代码 2. 有时Eclipe配置不好时，会出现source not found的问题。解决方法如下：（1) 打开window种的preference(2) 选择Java中的 Installed JREs (3) 单击右侧的jre并进行Edit(4）选择rt.jar文件并单击...

2018-07-17 12:40:23 5677 9

转载 Python编程学习14：Python日志之logging模块详解

一、logging模块（一）、日志相关概念日志是一种可以追踪某些软件运行时所发生事件的方法。软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情。一个事件可以用一个可包含可选变量数据的消息来描述。此外，事件也有重要性的概念，这个重要性也可以被称为严重性级别（level）。 1、日志的作用通过log的分析，可以方便用户了解系统或软件、应用的运行情况；如果你的应...

2018-07-16 19:20:39 272

原创 Python多线程的理解和使用（一）Threading中join()函数的理解

1. 多线程的概念多线程类似于同时执行多个不同程序，多线程运行有如下优点：使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人，这样比如用户点击了一个按钮去触发某些事件的处理，可以弹出一个进度条来显示处理的进度程序的运行速度可能加快在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存...

2018-07-16 18:57:10 7654 1

原创机器学习笔记5：机器学习策略之方差和偏差

本文主要参考吴恩达的机器学习课程。一、机器学习中的各种策略：开发一个完整的机器学习项目要经历：使用训练集训练模型--->开发集调整模型参数--->测试集测试模型效果--->上线实际使用。 1. 如果模型在训练集上表现不好，可采取的策略有：选择更大的神经网络（即更复杂的模型），使用AdamOptimizer等替代随机梯度下降法来...

2018-07-13 15:17:50 310

原创 Python编程学习13：python魔法方法

在python中，有一些内置好的特定的方法（总是被双下划线包围，如__init__），这些方法在进行特定的操作时会自动被调用，称之为魔法方法 1. 构造 __init__ 方法，相当于Java中的构造方法，在实例化的时候会自动调用。__new__方法，在__init__之前被调用，返回的是对象，极少去重写它。当继续一个不可变类型，但是又需要对它进行修改时，可以重新__new__ ...

2018-07-10 13:24:14 297

原创 sklearn feature selection特征选择

1

2018-07-10 10:21:41 2685

原创 004_sklearn pipeline 和Gridsearch的使用

第一个参数estimator为进行训练的模型，parameters是模型的参数词典。parameters中的key为模型参数名称，value为模型参数的值的元组（包含多个可选择的值）。自动化 Grid Search，只要预先设定好使用的 Model 和参数的候选，就能自动搜索并记录最佳的 Model。然后用 Pipeline.fit对训练集进行训练，pipe_lr.fit(X_train, y_train)pipeline 实现了对全部步骤的流式化封装和管理，可以很方便地使参数集在新数据集上被重复使用。

2018-07-10 09:43:01 5383 1

原创七月在线笔面试题解析1：python3函数中参数可变的理解

1. 如果传入的参数是不可变类型，则函数中对其进行更改时不影响函数外部该变量的值def test(a): a += 1 return aa = 10b = test(a)print(a)print(b)10112. 如果传入的参数是可变类型，则函数中对其进行更改时会影响函数外部该变量的值def test(a):# a.append(7) a +=...

2018-07-06 21:25:50 199

原创 Python3 pymysql操作mysql数据库（一）

一. 连接mysql : pymysql.connect()import pymysql# 连接数据库conn = pymysql.connect(host='127.0.0.1', user='***', # 数据库用户名 passwd='***', # 密码 ...

2018-07-06 16:02:43 2039

原创 pymysql插入数据到mysql: Insert error: (1054, &quot;Unkonw column '*' in 'field list' &quot; )

在使用scrapy 爬取汽车评论时，insert语句执行老是出错1. 保存长文本：mysql 保存长文本需使用text类型create_command = 'create table evComm3(car_name varchar(20), advant text, disadvant text, sums text, support_num int(8))'cursor.execute(cr...

2018-07-06 08:20:59 1441

原创 Python 多进程multiprocessing模块, Process, 进程池Pool和Queue

1

2018-07-05 15:12:23 22930 1

原创 Python scrapy项目中.py文件无法保存：Unable to save file 'items.py' Cannot save items.py

1. 问题描述在使用cmd 命令行创建scrapy project项目后，对items文件进行更改时发生错误。（1）spyder编辑器显示 Unable to save file 'items.py' Error message: [Errno 13] Permission denied: ... 等错误信息。（2）pyChra...

2018-07-03 10:25:48 8624

原创 pandas 之 to_csv 保存数据出现中文乱码问题及解决办法

1. 使用scrapy框架爬取了一些汽车评价保存在csv文件中，但是直接打开时乱码了。2. 使用pandas读取再使用to_csv()方法重新保存import pandas as pdfile_name = 'G:/myLearning/pythonML201804/spiderLearning/scrapy_learning/car_comment_crawler/\ ...

2018-07-02 21:29:03 154438 67

原创 Python爬虫学习6：scrapy入门（一）爬取汽车评论并保存到csv文件

一、scrapy 安装：可直接使用Anaconda Navigator安装，也可使用pip install scrapy安装二、创建scrapy 爬虫项目：语句格式为 scrapy startproject project_name生成的爬虫项目目录如下，其中spiders是自己真正要编写的爬虫。三、爬取腾讯新闻并保存到csv文件 1. 只爬取一个页面：在spiders目录下创建spi...

2018-07-02 21:06:11 2715

原创 Python爬虫学习5：使用cookie访问网页（以豆瓣为例）

1. 先在浏览器上登录豆瓣，登录成功后打开开发者工具，可以查看到Cookie. 第一次登录后，短时间内再次打开此页面时，会发现系统已经保存了cookie, 不用再重新登录。时间长了cookie会失效，需重新登录.2. 实现代码import requestsheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) ...

2018-07-01 17:21:15 10868 1

原创 Python爬虫学习4：requests.post模拟登录豆瓣（包括获取验证码）

1. 在豆瓣登录网页尝试登录后打开开发者工具，可以查找后去Headers和Form Data信息。2. 实现代码import requestsimport html5libimport refrom bs4 import BeautifulSoups = requests.Session()url_login = 'http://accounts.douban.com/login'...

2018-07-01 17:15:02 4811 3

原创 Python爬虫学习2：Beautifulsoup的使用

11

2018-07-01 16:49:24 275

原创 Python爬虫学习1：requests库

get, r.text, r.status_code, r.encoding, r.content, r.json, r.iter_content, requests.post, r.cookies

2018-07-01 16:32:15 1395

zhuzuwei的博客