自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 爬虫——手机抓包,fiddler抓取手机qq请求

fiddler一个抓包工具,我们每一个页面请求,都可以被它检测到,用于分析请求,模拟手机,浏览器请求,制作我们的爬虫程序。 我要做一个模拟QQ群搜索的工具1.配置电脑端的fiddler2.手机和电脑连接在同一wifi上面(没有wifi可以用360免费wifi用笔记本开一个)3.手机连接wifi并设置代理端口是fiddler设置的8888 4.手机用浏览器...

2018-08-14 18:07:06 6118 1

原创 机器学习聚类分析——k-means文本聚类分析

最近比较喜欢听《认真的老去》这首歌,那就抓这个豆瓣评论做数据集吧,,做个评论的聚类分析。 一、抓到数据 抓出来140条评论~~  放代码~~  import requestsfrom bs4 import BeautifulSoupstart_page = 1end_page = 7data = []while start_page <...

2018-08-13 17:59:20 3852 1

原创 数据分析工具推荐-tableau

我是从excel起步的,对excel非常了解,做数据分析画图表时,会明显感到excel的图表的美观度较差,需要调很多的参数。后来,接触到tableau这个软件,感觉还不错。excel适合数据处理,tableau适合图表展示。     原创(AI_大数据)文章,公众号首发,欢迎您的关注打赏作者(下图),未来写出更好的文章及教程 ...

2018-08-10 16:16:29 1143

原创 python_pandas操作-数值上下滑动一个格

我在做上证指数计算,  公式是:  涨跌幅= (今日收盘价-作日收盘价)/昨日收盘价    那么在pandas中如何操作呢? 1.抓到数据(卖萌)。。。 2.我们有了两列值(日期,今日收盘价)那么我们如何求得昨日收盘价呢?今日收盘价上滑动一个格。data['昨日收盘价'] = [0] + list(data['今日收盘价'].values[:-1])...

2018-08-10 16:13:12 784

原创 机器学习特征工程之皮尔森相关系数 pearson correlation of features

示例图:皮尔森相关系数为了确定 每个特征之间是否紧密相关,如果很相关就属于重复特征,可以去除。 我们输入机器学习模型中的每个特征都独一无二,这才是最佳。python实现代码import seaborn as sns #图表模块import matplotlib.pyplot as plt #绘图模块库colormap = plt.cm.RdBu # 绘图库中的颜色查找表。比...

2018-08-09 17:30:27 3556

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除