自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (3)
  • 收藏
  • 关注

原创 网易云音乐上的所有!全部!随便爬!(Python爬虫&基于网易云音乐评论的用户推荐系统)

申明:本文纯属原创,有参考的地方都会在文中给出链接。如有转载,需征求本人同意。一、目标网站介绍网易云音乐是一款由网易开发的音乐产品,是网易杭州研究院的成果,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以歌单、DJ节目、社交、地理位置为核心要素,主打发现和分享。2017年11月17日,网易云用户突破4亿。知乎上有这样一个问题:你为什...

2019-02-01 21:30:45 9840 4

原创 教女朋友学数据挖掘——泰坦尼克号获救预测

泰坦尼克号-数据挖掘案例解读数据挖掘流程:(一)数据读取:读取数据,并进行展示统计数据各项指标明确数据规模与要完成任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况影响统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性(四)建立模型特征数据与标签准备数...

2019-02-25 18:26:26 3715 1

原创 教女朋友学数据分析——可视化库Seaborn

可视化库SeabornNoteSeaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。一、 整体布局风格设置导入包,其中%matplotlib具体作用是当你调用matp...

2019-02-24 21:37:16 1784

原创 教女朋友学数据分析——数据可视化库Matplotlib

数据可视化库MatplotlibNoteMatplotlib 是一个0 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。一、折线图绘制数据文件’unrate.csv’:这份数据统计了美国从1948年1月到2016年8月每个月的失业率。读取数据:import pandas as pdunrate = pd.read_csv('unrate...

2019-02-20 10:49:28 1170

原创 教女朋友学数据分析———数据分析库Pandas

哦,不,这个:Pandas数据分析处理库pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。一、数据读取import pandasfood_info = pandas.read_csv("G:\\food_i...

2019-02-18 08:59:15 1860

原创 教女朋友学数据分析—科学计算库Numpy

科学计算库numpyNumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。一、IO文件操作numpy提供了一个打开txt文件的函数genfrontxt,文件...

2019-02-16 17:53:00 267

原创 Python网络爬虫之网络请求

一、urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。1.1 urlopen函数:在Python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面了,以先来看下urlopen函数基本的使用:from urllib import requestresp ...

2019-02-14 12:11:42 10618

原创 Python网络爬虫之爬虫前奏

爬虫前奏一、网络爬虫概述1.1 爬虫的实际例子:搜索引擎(百度、谷歌、360搜索等)。伯乐在线。惠惠购物助手。数据分析与研究(数据冰山知乎专栏)。抢票软件等。1.2 什么是网络爬虫:通俗理解:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。专业介绍:百度百科。1.3 通用爬虫和聚焦爬虫:通用爬虫:通用爬...

2019-02-11 20:59:05 322

旷视科技南京研究院负责人魏秀参 细粒度级别图像分析领域的现状与展望.pdf

旷视科技南京研究院负责人魏秀参,细粒度级别图像分析领域的现状与展望。 细粒度图像分类综述性PPT,对于研究图像分类会有很大帮助。

2020-03-04

An Introduction to Statistical Learning_with Applications in R

统计学习中相当经典的一本书籍,当当网上纸质版最便宜628元,美国发货,不退货,5-8周才到。书籍字迹很清晰,内容用PDF打开都可以复制,相当好的一本用于R语言实战和统计学习的一本书。一些统计专业的学生可能并不知道这本书,但是下载下来是绝不后悔的。

2019-02-15

复杂数据统计方法-基于R应用(第三版)

强烈推荐这本书,特别适合学习R的小盆友,吴喜之教授在统计学专业领域德高望重,他的书讲解特别明白,理论部分不需要担心。并且,这本书实战性特别强,带着例子学R编程,简易好掌握!

2019-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除