2017年08月_哈士奇说喵

11月 10月 09月 08月 07月 06月 05月 04月 03月 01月

原创总结：数据清洗的一些总结

前言在整理项目的时候发现清洗过程是一个非常细节的过程，几乎贯穿始终，也是后续步骤特征提取等的前置条件，所以整理如下,因为展开较大，所以我已近上传mindnode脑图和原始照片尺寸，请在这里下载数据清洗脑图原版致谢机器学习基础与实践（一）—-数据清洗箱形图为什么能检测异常值，原理是什么？五个步骤教你数据清洗数据清洗基本概念标准化矩阵协方差矩阵相关系数矩阵数据挖掘数据预处理之：异常值检测数据

2017-08-25 14:31:54 4906

原创网易2018校招内推编程题（Python描述）

总结一下网易2018内推的测试题，我看python的比较少，所以献上自己的low代码，都AC过的，大毛病应该没有，看来基础还是得抓紧练习！[编程题] 彩色的砖块时间限制：1秒空间限制：32768K 小易有一些彩色的砖块。每种颜色由一个大写字母表示。各个颜色砖块看起来都完全一样。现在有一个给定的字符串s,s中每个字符代表小易的某个砖块的颜色。小易想把他所有的砖块排成一行。如果最多存在一对不同颜色

2017-08-14 20:12:42 5696

原创总结：Spark性能优化上的一些总结

Spark性能调优整理来自于： Spark性能优化指南——基础篇会增加：一些其他博客的内容自己的理解和pyspark代码的补充实践开发调优 Spark性能优化的第一步，就是要在开发Spark作业的过程中注意和应用一些性能优化的基本原则。开发调优，就是要让大家了解以下一些Spark基本开发原则，包括：RDD lineage设

2017-08-13 10:33:58 2420

原创总结：详细讲解MapReduce过程(整理补充)

关于整理此文百分之七十摘自我认为讲的很清楚的博客，我都贴了地址，很感谢这些博主的无私奉献！我再将一些自己的实例代码和知识点的补充加入进去，希望能更好的理解mapreduce的整个过程。从启动和资源调度来看MapReduce过程首先-先了解一下必知概念 From：MapReduce工作原理图文详解，JobTracker和TaskTracker概述客户端（Client）：编写mapreduc

2017-08-06 17:05:16 27359 6

原创总结：Hive，Hive on Spark和SparkSQL区别

Hive on Mapreduce Hive的原理大家可以参考这篇大数据时代的技术hive：hive介绍，实际的一些操作可以看这篇笔记：新手的Hive指南，至于还有兴趣看Hive优化方法可以看看我总结的这篇Hive性能优化上的一些总结Hive on Mapreduce执行流程执行流程详细解析Step 1：UI(user interface) 调用 executeQuery 接口，发送 H

2017-08-04 22:36:07 44818 1

adb 安卓+win10调试工具

https://github.com/wangshub/wechat_jump_game项目中需要用到的adb工具

2018-01-01

机器学习实战-数据及源代码

机器学习实战 Peter Harrington著参考内容以及书籍中的代码

2017-10-09

基于python豆瓣自定义电影抓取2.0

相较于版本1.0更新说明 ---- 1.新增CMD版本的打包处理 2.新增存入word操作。 3.新增预告片链接，新增推荐相关电影。 4.自由度加强，可自定义对评论，简介，写入存储，推荐，计时(针对cmd版本)等采集开关，采集何种数据真正自由选择。 5.简化代码，优化代码结构，更加清晰明了富有逻辑(自认为) 更多请详见我的博客，谢谢

2016-10-01

knn算法实例Python版本

本exe文件适用于win8/10 64位系统文章请参考本人博客 CSDN MrLevo520或者简书MrLevo520，内有详细分析 1.测试数据集为datacombinlabel.txt 2.测试时注意选择路径，可参考实验截图最后祝大家学习愉快，转载分享请注明出处，谢谢 by 哈士奇说喵 2016.9.8

2016-09-08

请先安装MySQL,并进行测试连接，exe文件可用于win8/10 x64 注意exe除非环境和我一样，否则不能运行的，我的设置是host = '127.0.0.1',user='root',passwd='A089363b' 注意还是自己从源码修改然后用pyinstaller进行修改吧用户加密存储系统--用于托管第三方数据库，内容进行加密后存储，没有秘钥无法破解 1.用户存储，登录，查看，删除操作，存储在数据库中 2.用户密码加密存储，密码加密方式可选，目前只可选MD5和SHA1，用户存储内容加密存储，加密方式自定义 3.自定义（我自己定义了一个加密解密函数）加密序列，拿到内容没有序列无法解密 4.可更改用户密码，更改自定义KEY，更改加密存储内容 have fun！如果有BUG请与我联系，也可以在我主页留言博客http://blog.csdn.net/MrLevo520 谢谢

2016-08-04

基于python豆瓣自定义电影抓取GUI版本1.0

7.23更新 1.增加电视剧选项，每周TOP选项 2.修复查看TOP40之后程序出错问题 3.缩减代码量

2016-07-23

基于python豆瓣自定义电影抓取GUI版本

请先安装火狐浏览器，并设置为默认浏览器，支持win8/10 x64 1.可以选择电影种类，排序方式，TOP个数，等自定义 2.加载热评，长评 3.接口丰富，之后可以自行改造，附上源程序，有python环境的自己打开就行 4.请让exe文件和phantomjs.exe在同一文件夹下运行，允许其运行 enjoy yourself！ 7.22更新 GUI版本

2016-07-22

参考文献生成器1.0

1.参考文献格式以哈尔滨工程大学毕业论文为基础，因为本校特码不是国标那种类型的！艹 2.具体事例参考图片 3.支持作者大小写混写（反正自动纠正为首字母大写），中文不做改变 4.支持题目大小写混输入，可选择题目改变类型 5.目前支持四种格式，期刊，论文，书籍，会议，以后可根据情况再加入 6.支持起始页尾添加'P'或者'页',其实都是支持字符串输入的 6.若不选择格式类型，题目类型，默认为期刊，题目不做改变 7.此为beta版本，若有建议请联系MrLevo@outlook.com或15645183037@163.com 8.如果想定制自己学校的参考文献生成器，请将word格式的四种论文格式模板发送至7的邮箱。 9.最后，此软件完全免费，绿色，大小为7.12MB,请勿用于商业用途（虽然很low但是这是定制版本，和cnki这类不一样，btw，cnki那个160+mb还要钱！） have fun！ ----2016.7.9更新 1.增加对输入文献的多选复制 2.增加对长文献的拖拽查看

2016-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

MrLevo520的博客

原创总结：数据清洗的一些总结

原创网易2018校招内推编程题（Python描述）

原创总结：Spark性能优化上的一些总结

原创总结：详细讲解MapReduce过程(整理补充)

原创总结：Hive，Hive on Spark和SparkSQL区别

adb 安卓+win10调试工具

机器学习实战-数据及源代码

数据清洗mindnode原图

618价格分析echarts

WinSCP_5.9.0.6786_Setup.exe

dermatology.data

mingw64安装

豆瓣电影名称类别评分时长评论年份爬取主函数

基于python豆瓣自定义电影抓取2.0

KmeansEating

knn算法实例Python版本

Python+MySQL用户加密存储验证系统

基于python豆瓣自定义电影抓取GUI版本1.0

基于python豆瓣自定义电影抓取GUI版本

参考文献生成器1.0

基于python豆瓣自定义电影抓取

参考文献格式生成器

Matlab完整版车牌定位识别

完全可用的车牌定位识别

空空如也

原创 总结：数据清洗的一些总结

原创 网易2018校招内推编程题（Python描述）

原创 总结：Spark性能优化上的一些总结

原创 总结：详细讲解MapReduce过程(整理补充)

原创 总结：Hive，Hive on Spark和SparkSQL区别

adb 安卓+win10调试工具

机器学习实战-数据及源代码

数据清洗mindnode原图

618价格分析echarts

WinSCP_5.9.0.6786_Setup.exe

dermatology.data

mingw64安装

豆瓣电影名称类别评分时长评论年份爬取主函数

基于python豆瓣自定义电影抓取2.0

KmeansEating

knn算法实例Python版本

Python+MySQL用户加密存储验证系统

基于python豆瓣自定义电影抓取GUI版本1.0

基于python豆瓣自定义电影抓取GUI版本

参考文献生成器1.0

基于python豆瓣自定义电影抓取

参考文献格式生成器

Matlab完整版车牌定位识别

完全可用的车牌定位识别

空空如也

原创总结：数据清洗的一些总结

原创网易2018校招内推编程题（Python描述）

原创总结：Spark性能优化上的一些总结

原创总结：详细讲解MapReduce过程(整理补充)

原创总结：Hive，Hive on Spark和SparkSQL区别