- 博客(13)
- 资源 (20)
- 收藏
- 关注
原创 最简单的理解lambda,map,reduce,filter,列表推导式
Python 2.7 IDE Pycharm 5.0.3为什么要用Lambda 一句话,因为懒,懒得新建一个一次性使用函数,懒得想函数名,想要更高逼格的pythontic!比如说,我要实现一个x*y+x的功能,没有lambda之前我要这样做:#定义一个函数def Whatever(x,y): return x*y+x#调用函数 f = Whatever(22,3)print
2016-09-21 18:15:27 3001 1
原创 【伪】解决动态id元素无法捕捉自动登录问题
Python 2.7 IDE Pycharm 5.0.3原因不止一个小伙伴告诉我,想模仿我的一键CSDN写博客想模拟登录qq或者网易邮箱,但是貌似用xpath和css都不行了,我尝试了一下,原来他们采用动态id了。所以直接定位id已经不能用了,但是xpath找来说应该只是路径,和具体变量无关吧,为什么还是不行呢?我现在尝试了网上若干方法,都不成功,所以我抖了个机灵~解决方案额,目前我没有找到根治的
2016-09-19 19:14:18 2634 1
原创 用机器学习来帮助吃货的你找最合适的聚点(Python描述)
Python 2.7 Pycharm 5.0.3 Geopy 1.11 图形展示 地图无忧-网页版你可能需要知道1.机器学习之K-means算法(Python描述)基础 2.经纬度地址转换的方法集合(Python描述) 3.想要知道怎么实现的可能还要python等相关知识 4.看官随意前言 这次厉害了,我爬出了哈尔滨市TOP285家好吃的店,包括烧烤的TOP,饺子的TOP,酱骨
2016-09-19 11:28:59 2357
原创 经纬度地址转换的方法集合(Python描述)
Python 2.7 IDE Pycharm 5.0.3 Geopy 1.11前言这只是我想做的一部分,写一块太大了,单独记录目的获取2015年GDP TOP100城市并获取城市对应经纬度,存入txt后续操作获取GDP TOP100城市查询网址如下http://www.redsh.com/a/20160126/171501.shtml 2015中国100大城市GDP排行榜TOP100出炉!
2016-09-16 17:16:59 15297
原创 机器学习之K-means算法(Python描述)基础
Python 2.7 IDE Pycharm 5.0.3 numpy 1.11.0 matplotlib 1.5.1可以扩展阅读: 1.(大)数据处理:从txt到数据可视化 2.机器学习之K-近邻算法(Python描述)基础 3.机器学习之K-近邻算法(Python描述)实战百维万组数据数据及参考代码 github地址,下载压缩包,ch10前言从程序上读懂每一行,才是了解算法的开始。
2016-09-14 16:26:40 2774 1
原创 2017校招去哪网,阿里,网易,中兴,华为笔试编程题五则(Python描述)
前言 学长忙着找工作,今天几轮笔试,把能拍到的笔试题都给我写了写,我想对明年找工作或者实习有所帮助第一题,去哪网笔试题题目我个人感觉难度还可以,我自己写了好久,三道题,一道重复,还有一题同学没拍到,总共时间给两个小时,时间给的久,相比有点道理。估计读题目就刷掉个一半了。。。。简单说一下(我同学翻译的,我自己懒得看),就是说,给定一串字符串,给定个分割阈值,然后进行分割,要是分割边界切坏了一个单
2016-09-09 21:44:08 2517
原创 机器学习之K-近邻算法(Python描述)实战百维万组数据
Python 2.7 IDE Pycharm 5.0.3 numpy 1.11.0 matplotlib 1.5.1建议先阅读: 1.(大)数据处理:从txt到数据可视化 2.机器学习之K-近邻算法(Python描述)基础 3. 教程来自于《机器学习实战》第二章 4. 代码及数据github@Mini-Python-Project中的DataSource文件夹下有个压缩包前言通过基础的
2016-09-08 14:02:52 2412
原创 解决:将.mat文件保存到.txt不带有科学计数法e-0
Python 2.7 IDE Pycharm 5.0.3 Matlab 2014a遇到问题在进行数据处理的时候,比如说我正好遇到KNN算法的python描述,但我的数据集是matlab的.mat文件,我想要用python处理数据的话,mat是不可行的,那怎么办呢?解决思路python能读入的是txt,现在数据很多也是存在txt中的(以我接触的一些数据来说),python读取txt是非常方便的,而
2016-09-08 13:53:20 8093
原创 (大)数据处理:从txt到数据可视化
Python 2.7 IDE Pycharm 5.0.3 numpy 1.11.0 matplotlib 1.5.1 本次可视化数据由机器学习实战倾情提供(就是盗用了数据和改了一点点程序更加易读)前言将txt中数据进行可视化展示用于分析需求你只需要知道 每行的第一列数据是飞行里程,第二列是玩游戏所占百分比时间,第三列是每年吃的冰激凌消耗量,第四列是某个xx觉得这类人的适合约会的感兴
2016-09-08 13:52:33 4155 1
原创 机器学习之K-近邻算法(Python描述)基础
Python 2.7 IDE Pycharm 5.0.3 numpy 1.11.0前言总算迈入机器学习第一步,总比原地踏步要好。什么是K-近邻?一句话总结,物以类聚,人以群分,更‘靠近’哪一个点,就认为它属于那一个点。以一篇硕士论文截图说明Knn算法思想根据这个伪代码流程,我们就可以使用python进行算法重构了,分三步,一算距离,二排序,三取值实现Knn基础代码第一部分,被调函数,在主程序中
2016-09-03 20:03:22 1035
原创 NumPy快速入门
Python 2.7 IPython 4.1.2关于NumpyNumpy是Python的一个矩阵类型,提供大量矩阵处理函数,内部通过C实现。包含两种数据结构,数组array和矩阵matrix,其实就是array而已构建数组array通过tuple构建arrayIn[1]: from numpy import *In[2]: yuanzu = (4,5,6)In[3]: ll = arr
2016-09-03 17:19:28 1263
原创 (大)数据处理:从txt到MySql的数据预处理迁徙
Python 2.7 IDE Pycharm 5.0.3 MySQL 5.7 MySQL Workbench 6.3前言学长毕业刚好在整大数据,从数据堂花了大价钱买的一个月的北京出租车GPS数据,一天大概11G,一个月就是350G左右,而且数据全部存在txt中,根本无法进行分析处理,而且重复数据非常多,这就需要把txt写到数据库中在进行操作了,于是,我尝试了自己的python。。。。。猜一
2016-09-01 19:54:46 1173 1
原创 Python爬虫防封杀方法集合
Python 2.7 IDE Pycharm 5.0.3前言在爬取的过程中难免发生ip被封和403错误等等,这都是网站检测出你是爬虫而进行反爬措施,这里自己总结下如何避免方法1:设置等待时间有一些网站的防范措施可能会因为你快速提交表单而把你当做机器人爬虫,比如说以非常人的速度下载图片,登录网站,爬取信息。常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,
2016-09-01 10:59:01 11005 4
基于python豆瓣自定义电影抓取2.0
2016-10-01
knn算法实例Python版本
2016-09-08
Python+MySQL用户加密存储验证系统
2016-08-04
基于python豆瓣自定义电影抓取GUI版本
2016-07-22
参考文献生成器1.0
2016-07-21
基于python豆瓣自定义电影抓取
2016-07-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人