自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Windows server 2016下sharepoint server 2016及hybrid search使用

最近在探索sharepoint server 2016的使用和配置,刚开始真的是一头雾水,通过2,3天查找资料,我发现了一下三个资料是真的很有帮助,这里分享给大家。1. http://blog.51cto.com/lizmfinder/2317592 :这个里面有7个大步骤,需要2台电脑作为服务器进行配置。前期的配置是我需要的,后面的我不太需要,大家各取所需吧2. https://www....

2019-01-17 15:24:21 731

原创 pandas实例——MovieLens电影数据实战分析

在上一篇文章中我介绍了pandas的基本用法,今天我就用pandas实战操作,大家可以一起感受一下数据分析是如何从一堆数字中找到有价值的信息的。下面我也附上了代码,我强烈推荐大家将数据下载下来,亲自去实践敲一遍,我相信收获会更多。废话不多说!     HERE WE GO!!!一、数据集介绍我采用的数据是来自MovieLen的电影数据集(https://grouplens.

2017-11-15 04:55:59 6182 7

原创 Python数据分析利器——pandas简单教学

前一篇文章,我提到了python中用于矩阵处理的numpy库,今天我带来的是python数据分析中另一个很核心的库——pandas,它是python中分析结构化数据的工具集,最初设计出来用来处理金融数据,如今它用于处理各种各样的数据集。(预防针:pandas的结构与操作比numpy多很多,因此我只介绍操作方法,具体的参数在使用时一查即可 ^_^)注意:不知道为什么,下面代码开头可能有这样一

2017-11-13 06:31:30 2817 7

原创 Python数据分析利器——numpy简单教学

numpy是python下的一个第三方数据库,提供了高性能矩阵运算能力(别问我多高,我也不知道!反正就是高!!),它是数据分析的基础,更是数据分析的一把利器!!!一、安装与导入numpy不是python自带的库,所以使用前要先安装。像安装其他的第三方库一样,使用pip可以快速,方便,无污染的完成:sudo pip install numpy如果是windows系统或没有安装pip的

2017-11-12 07:58:14 722

原创 无聊消遣——基于pygame库的飞机大战

前一段在数据分析中突然感觉到了一阵阵的空虚寂寞冷,所以我决定小小放松一下,于是萌生出了写一个小游戏的想法。所以在pygame中摸索了2天,终于完成了无聊的飞机大战代码。之前从来没写过游戏,所以感觉还蛮好玩儿的。在此分享出来,有兴趣的可以拿去玩玩儿咯!!游戏完成的主要功能:①用户飞机由用户控制;敌机自动移动。②用户飞机由用户按空格键开火;敌机自动开火。③击毁敌机会使敌机子弹速度逐渐增

2017-11-09 05:06:25 2566 2

原创 Python网络爬虫中常用第三方库总结

python对于爬虫的编写已经是相当的友好了,不过除了利用requests库或者scrapy框架之外,有一些库还需要我们知道,以便于我们更熟练、便捷的完成目标数据的爬取,接下来我就总结一下我认为在爬虫中常用的几个库。一、rere库是正则表达式库,是regex的缩写,用于从网页源码或者数据文件中提取我们所需的数据,具体使用方法如下:①闯进过滤字符串的规定,一般用变量regex存储;②

2017-11-08 04:17:19 10824 1

原创 数据分析——以斗鱼为实例解析requests库与scrapy框架爬虫技术

按照我的理解,数据分析大概整体分为5大模块——数据收集、数据清洗、数据挖掘、数据建模、数据应用。今天,我便“开车”进军第一大模块!数据收集!!!!数据收集,通俗一点即爬虫技术,即利用脚本模拟浏览器行为向服务器发送请求并快速获取数据的过程。利用Python可以十分简单的制作一个爬虫(随便一搜,代码就哗哗嘀),因此我在这里就不赘述如何去写一个简单的爬虫了。这篇文章我将倾向于如何分别利用requ

2017-11-08 02:23:53 3264 2

原创 Python基础操作回顾

如今的数据分析流行语言个人认为主流以Python、R、MATLAB三大语言为主。由于本科阶段接触过Python,所以对它很有情怀,于是我决定在这里复习几个Python知识点,以便后面遗忘随时查阅,并为数据分析之路打好基础。先在此立一个Flag:12月,我会写一篇关于R语言的Blog,请我的主页监督我!!!一、随机函数库random:1、random.random():生成一个[0,1)

2017-11-05 01:44:00 306

原创 Linux终端下命令操作总结

在网上看招聘简章,许多公司都要求掌握Linux环境下开发,因此我便来总结一下linux终端操作命令,在此只列出基本操作,至于命令下具体选项,需要时查一下即可。基础命令篇:1、ls:显示当前文件夹文件,后面也可以跟路径,便可以查看该路径文件夹下的文件(不过一般好像不这么搞,反正我用的很少)。常用选项操作有:-a 显示隐藏文件;-l 列表详细显示文件信息;-hl 按照文件大小列表显示文件信息;

2017-11-04 04:16:48 1084

原创 新的开始,新的征程

现在是下午2017年11月3日15点05分,地点在休斯顿大学Moody Towers North 12层休息室,我开始了我的博客生涯。我的博客生涯比许许多多人晚了好久。为了记住许许多多的知识点,也为了与广大程序员互相学习,互相进步,来美读研的我才想起来写写技术博客。但是,只要在路上,永远不晚。最后在此立下个Flag,明年毕业以后,为了蚯蚓回国找工作,我不愿意独自留在美国,蚯蚓说他受不了

2017-11-04 04:05:28 541

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除