![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
弥野月亮
人丑就得多读书。
展开
-
如何成为数据分析师
1.学完基本知识以后, 就是时候去刷题网站 LeetCode 测试一下自己的掌握程度了:2.这里推荐一门python免费网课:Programming Foundations with Python | Udacity:3.Tableau官网的制图教程,非常简单明了:4.A/B test5.数据分析和建模的项目:...原创 2019-04-22 20:40:50 · 150 阅读 · 0 评论 -
智能导诊--菜鸡的程序人生
多分类的事情,为了能效仿B站的情绪二分类的讲解视频,我60多个门诊当中,选取了两个案例最多的门诊,分别是内科急诊和妇科门诊,二者区分度也比较大,应该有助于网络的训练。通过pandas可以直接按照列标签分类,并直接导入到txt文件:'''本程序目标为从原始数据提取出各个门诊标签的数据'''from pandas import DataFrameimport pandas as pdd...原创 2019-08-19 17:47:38 · 1562 阅读 · 3 评论 -
东方财富数据分析岗笔试题记录
企业净资产收益率对统计假设H0构造显著性检验方法,对不同的样本观测值,拒绝域相同。用来说明企业盈利能力的是:每股盈余二项分布、泊松分布、正态分布、t分布的关系资本资产定价模型求普通股成本(http://www.dongao.com/zckjs/cg/201309/117412.shtml)已知折现率,求债券价值常见财务指标异常(https://wenku.baidu.com/view...原创 2019-08-06 22:37:47 · 2883 阅读 · 2 评论 -
爬取腾讯视频的评论
技术:浏览器伪装Fiddler解析url的js文件代码如下:'''爬取腾讯评论技术:浏览器伪装、每次加载评论的对应url也做规律性改变网址url通过Fildler抓包分析获取(https)最后打算通过正则的方式剔除网页中一些不太友好的内容 但不是很理想'''import urllib.requestimport reimport urllib.errorheaders=...原创 2019-07-26 10:28:21 · 587 阅读 · 0 评论 -
智能导诊项目
利用csv模块读取csvFile = csv.reader(open(r'trainingData.csv',encoding="utf-8"))for item in csvFile: print(item)利用pandas模块待续原创 2019-07-29 14:17:02 · 1518 阅读 · 0 评论 -
windows下anaconda安装scrapy框架
前言:尝试了pip安装的方式,总是失败,最终采取anaconda在虚拟环境tensorflow里面安装scrapy框架;在window里面装这种框架还是容易出错,想深入数据分析的话,还是用linux搭建各种处理平台。指令用到的特别少,切换到相应的安装目录conda install scrapy;//这一步就等待安装包即可conda install service_identity;//安装依...原创 2019-07-10 20:57:26 · 450 阅读 · 0 评论 -
爬虫代理服务器
免费代理网站:https://www.xicidaili.com/使用了几个代理不太管用,最后使用这个爬到了:proxy_addr = “163.125.251.172:8088”代码段如下–百度好像这样爬不到内容,data的长度很短,CSDN博客首页就可以。import urllib.requestimport urllib.errordef user_proxy(url,...原创 2019-07-10 10:58:41 · 848 阅读 · 0 评论 -
爬取CSDN博客首页显示的所有文章,并将其网页链接下载到本地
难点-浏览器伪装,添加报头,获得CSDN首页数据;正则匹配,将需要的网址进行匹配;正则匹配完成的网页链接,使用urlretrieve爬取并下载到本地html文件'''爬取CSDN博客首页显示的所有文章,并download到本地'''import urllib.requestimport urllib.errorimport redef getHtml(url): # 利用浏览...原创 2019-07-09 10:54:53 · 962 阅读 · 3 评论 -
matlab中smooth函数的用法
%SMOOTH Smooth data.% Z = SMOOTH(Y) smooths data Y using a 5-point moving average.%% Z = SMOOTH(Y,SPAN) smooths data Y using SPAN as the number of points used% to compute each element of Z....原创 2019-06-11 14:27:20 · 17849 阅读 · 0 评论 -
SQL其他学习分享
简单SQL测验:问题:通过 SQL,您如何按字母顺序选取 Persons 表中 LastName 介于 Adams 和 Carter 的所有记录?您的回答:SELECT * FROM Persons WHERE LastName>‘Adams’ AND LastName<‘Carter’正确答案:SELECT * FROM Persons WHERE LastName BET...原创 2019-05-28 22:07:17 · 203 阅读 · 0 评论 -
LeetCode-SQL-刷题记录
1.【175. Combine Two Tables】select FirstName, LastName, City, State from Person left join Addresson Person.PersonId=Address.PersonId;注意:left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录 【和联结字段不相等的也要返回,只是显示...原创 2019-05-06 21:41:37 · 156 阅读 · 0 评论 -
Hadoop集群下跑.py文件(入门wordcount)
hadoop jar /export/servers/hadoop-2.7.4/share/hadoop/tools/lib/hadoop-streaming-2.7.4.jar -D stream.non.zero.exit.is.failure=false \-file /export/servers/hadoop-2.7.4/test/code/mapper.py \-mapper /e...原创 2019-08-27 15:25:26 · 337 阅读 · 1 评论