自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 特征工程思维导图

用xmind总结了下特征工程,如下图

2017-12-18 21:21:35 970 1

原创 基于神经网络的依存句法分析

论文A Fast and Accurate Dependency Parser using Neural Networks程序注释最近接触到依存句法分析,参考的是14年Chen&Manning的论文(A Fast and Accurate Dependency Parser using Neural Networks),下载了一个程序(原网址),注释下,当做备忘背景介绍

2017-12-18 17:00:29 5706 3

原创 糗事百科爬虫用户统计

糗事百科爬虫用户统计以前爬了糗事百科,一些数据还是挺有意思的:工作 搬砖汉应该是调侃自己的,不过人数比较多的手艺汪,学生汪,家里蹲应该有一些共同点,那就是时间比较自由故乡 基本上人口基数大的地方用户也多,比如河南、山东、四川等婚姻状况 估计单身狗会比较多☺星座 注册时间 很多用户都是在04、05年左右注册的,看来那时候风头挺火,现在似乎不如以前了总结下来就是一堆时间

2017-12-14 17:12:12 349

原创 SVM思维导图

之前整理了一些算法的思维导图,现在贴上来,整理的原因就是感觉比大段的文字看着直观多了,这个是支持向量的

2017-11-30 16:36:16 855

原创 商场中精确定位用户所在店铺

之前参加了阿里云的天池比赛,因为是第一次,也是一个人做,成绩不怎么样,差一些进入决赛,把程序和思路记录下,方便以后查询比赛的网址是链接 核心支撑思想是,手机的wifi可以搜索附近所有可以链接的wifi信息并推送至服务器上,在我们进入商场购物的时候,手机wifi将当前所连接的wifi信息、wifi定位信息推送至服务器上,如果以后有人连接了类似的wifi,那么这个人就有可能在这个店铺购物。

2017-11-30 12:12:09 1889

原创 糗事百科全站爬虫

之前看到有人写糗事百科的爬虫,就爬了几个页面,感觉太少,一个专业的段子手怎么能忍; 本文中使用多进程加多线程,段子用户id保存至redis数据库,用户数据及段子内容存储至mongodb; 本人自己的代理池前段时间没了,这里用的是阿布云代理,说的是每秒支持并行5个代理,其实没有这么多,买了三个账号连续爬一天,总共爬到30多万个用户数据,段子200多万个 阿布云账号一小时一块钱 数据库:

2017-10-19 21:48:30 974 1

原创 Windows Ubuntu双系统安装备忘

Windows Ubuntu双系统安装备忘出于个人需要安装两个系统,Ubuntu和Windows,在安装的过程中踩了不少坑,特此记录下本人电脑配置是240G固态+1t磁盘,固态分了两个区,分别安装Windows与Ubuntu安装步骤:安装Windows系统,使用软碟通打包Windows安装包至U盘,设置电脑通过U盘启动重启电脑进入系统安装环境,格式化整个固态硬盘,分区80G安装Windows系

2017-10-11 16:38:00 379

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除