自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 字节跳动-数据分析笔试回忆20181008

这是一篇博主含泪写下的笔经   120min时长,五部分。 第一部分80min内完成。四道简答题 十分钟10个推理题计算类型 十分钟10个数字规律题 十分钟三个段落信息或图表,十个小问题 十分钟,推理计算题,理论应该是10个但我最后只有6min时间 进去只显示了7个 说明:时间从19到21点,因为有各部分点进去和提交要时间所以你各个题做题时间+提取题目+提交每部分时间>120m...

2018-11-05 22:40:32 25150 5

原创 Py爬虫后的数据分析+出图

隔了好久都没及时把爬虫后的数据进行处理,干吗去了呢,看了个异步加载网页爬虫以及emmm校园琐事,今天填坑。 上次爬虫后主有六个维度的信息:价格、面积、当前热度,这三个是数值型的;区域、描述、户型,这三个是文本型。 这次并没有对户型和描述做分析,这个放在下次单独学  词云的作图。 先对数值型进行分析 df.describe() Out[10]: price...

2018-10-24 12:41:37 2706

原创 Py里面浮点数精度的问题--在numpy中

引言,今年是py加入全国计算机二级大礼包的第一年,看了几道题,比如: 0.1+0.1==0.2  返回True 0.1+0.2==0.3返回False 都是0 1 二进制惹的祸,真是一点不省油。。。。弄好久   累 对于十进制,它只能表示以进制数的质因子为分母的分数。10 的质因子有 2 和 5。比如1/2、1/4、1/5、1/8和 1/10 都可以精确表示,因为这些分母只使用了10的质因...

2018-10-01 20:35:14 6772

原创 Py爬虫北京租房价格数据

记录自己的练习第一条! 最近北京的租房市场掀起了轩然大波,作为即将租房的人就顺便练手下爬虫北京的租房价格。爬房价已经有很多人在做了,但我还是分享些不同思路给大家。 首先是数据来源的网站,目前比较火的链家、自如、蛋壳的都可以。 仔细看了下这三家网站,自如在价格页面处用的是图的显示,链家和蛋壳都是字符,如若要爬自如就需要用图像识别的库,当然数字只有0-9,不需要图像识别那么高级只需要匹配0-9与...

2018-09-20 22:52:38 1045

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除