![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析工具学习帖
SophiaSSSSS
这个作者很懒,什么都没留下…
展开
-
windows10/Mac下安装fbprophet及使用虚拟环境
Prophet是Facebook 在2017年2月开源的一款基于 Python 和 R 语言的时间序列预测框架,也是一种数据分析工具。github官网:https://github.com/facebookincubator/prophetprophet是基于可分解(趋势+季节+节假日)模型的开源库,Prophet充分的将业务背景知识和统计知识融合起来,它让我们可以用简单直观的参数进行高精度的时间序列预测,并且支持自定义季节和节假日的影响。官方号称“让普通人也能像数据分析师一样得出专业的结论”。原创 2022-10-28 13:29:30 · 2012 阅读 · 5 评论 -
Mac安装neo4j
1.安装brew install neo4j2.启动与关闭启动 neo4j start关闭 neo4j stop3.neo4j startActive database: graph.dbDirectories in use:home: /usr/local/Cellar/neo4j/3.3.4/libexecconfig: /usr/local/Cellar/neo4j/3.3.4/libexec/conflogs: /usr/local/Cellar/neo4j/3.3.4/lib转载 2022-03-08 15:42:42 · 1819 阅读 · 1 评论 -
【已解决】连接hive报错 ‘impala.dbapi‘
使用impala连接hive失败,报错提示如下:ModuleNotFoundError: No module named 'impala.dbapi'解决办法:安装以下几个包:原创 2021-11-10 09:40:20 · 4373 阅读 · 2 评论 -
【转载】Python遍历pandas数据方法总结
转载自脚本之家https://www.jb51.net/article/134753.htm 《Python遍历pandas数据方法总结》贴两条常用的,其他的移步原帖链接。列表解析方式disftance_list = [df.iloc[i][‘high']/df.iloc[i][‘open'] for i in range(0,len(df))]apply()方法循环方式apply()方法可将函数应用于dataframe特定行或列。函数由lambda方式在代码中内嵌实现,lambda函数的末转载 2021-06-26 19:41:00 · 363 阅读 · 0 评论 -
【练手帖】将本地Excel数据表格导入本地MySQL数据库(不推荐)
在将tushare当日数据获取到本地再导入数据库之前,先找个数据练练手。如下:参考:1、使用Python将数据插入数据库(一)https://www.cnblogs.com/dennis-liucd/p/7265641.html2、Python获取指定文件夹下的文件名的方法https://www.jb51.net/article/134543.htm时间:20201218结束备注:获取文件夹下的所有文件清单,在这个练手的操作中没用上,不过在之后批量调取tushare数据并批量调度入库,就用得上原创 2020-12-18 19:39:15 · 1038 阅读 · 1 评论 -
【数据可视化】FineReport 帆软报表入门记录帖(未完待续)
此番学finereport帆软可视化,一方面来源于个人理财研究之股票分析可视化看板的需求,另一方面来源于职业转型及精进的需要。前者,作为一颗小韭菜,为了尽快摆脱被割的厄运,也为了尽快有稳定的理财收益率;而后者,则希望尽快从跨行入行打杂的工作现状转型到更有含金量的工作岗位。本篇博客,聊以记录,也为分享。共勉。—— 起于2020.11.4早晨参考视频:B站 帆软基础入门教学视频https://www.bilibili.com/video/BV1NJ411u7A3?from=search&sei.原创 2020-11-04 09:25:49 · 3483 阅读 · 0 评论 -
【数据可视化】FineReport学习计划之SQL上篇(图片上传失败)
来源于FineReport学习计划表 https://bbs.fanruan.com/thread-77147-1-1.html中的SQL自学部分。这部分题目,网上没有答案,官方也明确不会提供答案。作为一个曾经已经SQL入门过了的人再来撸这套题,相对容易些。既然撸出来了,就来发个帖,一为知识分享,二为记录备忘。原创 2020-10-18 15:20:50 · 391 阅读 · 0 评论 -
用anaconda安装Python后,配置环境变量及更改jupyter notebook默认工作目录
由于原120G固态硬盘系统盘不够用,更换成了500G固态硬盘并重装系统,重装anaconda。所以在此记录一下安装anaconda之后需要进行的相关配置。STEP 1:添加环境变量不多说,直接一张图,四步到位(如下图)C:\ProgramData\Anaconda3;C:\ProgramData\Anaconda3\Scripts;C:\ProgramData\Anaconda3\Lib...原创 2019-07-01 23:23:07 · 4183 阅读 · 1 评论 -
jupyter notebook 高亮和代码自动补全
代码自动补全和高亮,当然是为了提高效率原创 2019-07-14 15:37:27 · 9344 阅读 · 0 评论 -
调整jupyter notebook 背景主题颜色
为保护视力,调整jupyter notebook 背景颜色。有看过一些帖子也都试过一些背景,目前感觉比较舒适的背景,其设置过程如下。记录下来备忘。参考链接:https://blog.csdn.net/wh8514/article/details/81532286—— —— —— ——安装Jupyter主题:pip install jupyterthemes然后,更新Jupyter主题:...原创 2020-05-31 17:49:43 · 9187 阅读 · 2 评论 -
Python安装TVTK库-用于科学计算三维可视化
看MOOC课程《Python科学计算三维可视化》,工欲善其事必先利其器:一开始提到先安装TVTK库,于是找一下网上的帖子来参考安装。安装TVTK库参考链接:https://www.jianshu.com/p/203a05390aa3—— —— —— —— ——下面开始表演。1.在网址为:http://www.lfd.uci.edu/~gohlke/pythonlibs/里下载以下内容:V...原创 2020-03-05 23:57:36 · 5662 阅读 · 3 评论 -
(备查)记录virtualbox_ubuntu部署Hadoop-hdfs的相关信息
在同事的帮助下,Hadoop-hdfs部署起来了。做为小菜鸟,为了防止之后忘了路径是哪个,存储空间占用了多少还剩多少可用,可能需要用到的XX参数是哪些,之类,先在这把一些基础信息记录一下,备查备忘。...原创 2019-08-03 22:56:08 · 167 阅读 · 0 评论 -
MOOC_MachineLearning_PracticeW1_Cluster_Kmeans聚类算法
# K-means 聚类算法# 案例:通过聚类,了解1999年各个省份的消费水平在国内的情况。# 技术路线:sklearn.cluster.Kmeans学习来源:MOOC-Python机器学习应用-CH1聚类-KMeans算法。附课程链接 https://www.icourse163.org/learn/BIT-1001872001?tid=1001965001#/learn/cont...原创 2019-07-17 22:03:17 · 557 阅读 · 0 评论 -
【曲折版】配置spark环境(含前期的虚拟机virtualbox、ubuntu系统、Hadoop布局、Java环境配置等)
看MOOC慕课网上的spark课程,首先配置spark环境。spark需要与Hadoop共同协作,所以在安装spark之前要先安装Hadoop,而spark和Hadoop又基于Java语言,所以在Hadoop之前需要先配置Java环境。然后问题又来了,整个spark、Hadoop运行环境,在非Windows系统上运行较佳,所以还得先装虚拟机和虚拟系统。。。下面从前到后按步骤来:本教程由厦门...原创 2019-07-11 21:57:56 · 1244 阅读 · 2 评论 -
【畅通版】配置spark环境(含前期的虚拟机virtualbox、ubuntu系统、Hadoop布局、Java环境配置等)
暨上一篇环境配置过程曲折,加上突然意识到25G的ubuntu系统不够干大事,自己的500G固态硬盘分了350出去当主系统盘之后,还有115G剩余,刚好可以把虚拟机和ubuntu全丢过去,又不会占用到原Windows系统盘的空间。于是重新装虚拟机和ubuntu系统,再在这基础上布局Hadoop、Java、spark等。附上一篇帖:【曲折版】配置spark环境(含前期的虚拟机virtualbox、u...原创 2019-07-13 10:48:22 · 861 阅读 · 0 评论 -
Python学习笔记 - Seaborn 可视化绘图
# Seaborn绘图学习# Matplotlib试着让简单的事情更加简单,困难的事情变得可能,而Seaborn就是让困难的东西更加简单。# 用Matplotlib最大的困难是其默认的各种参数,而Seaborn则完全避免了这一问题。# seaborn是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,够用了,如果需要复杂的自定义图形,还是要Matplotlib。#...原创 2019-05-12 11:54:31 · 908 阅读 · 0 评论 -
Mysql学习笔记-ch2-键表约束
mysql-ch2– mysql建表约束.sql– 主键约束它能够唯一确定一张表中的一条记录,也就是我们通过给某个字段添加约束,就可以使得该字段不重复且不为空。create table user(id int primary key,name varchar(20));insert into user values(1,“张三”);mysql> insert into us...原创 2019-03-20 11:52:05 · 138 阅读 · 0 评论 -
Mysql学习笔记-ch3-数据库的三大设计范式
– 数据库的三大设计范式.sql– 1.第一范式– 1NF– 数据表中的所有字段都是不可分割的原子值create table student2(id int primary key,name varchar(20),address varchar(30));– -- 解决"incorrect string value"alter table student2 convert t...原创 2019-03-20 11:56:01 · 119 阅读 · 0 评论 -
Mysql学习笔记-ch4-查询练习
– mysql查询练习cd C:\Program Files\MySQL\MySQL Server 5.7\bin– 学生表– Student– 学号– 姓名– 性别– 出生年月日– 所在班级create table student(sno varchar(20) primary key,sname varchar(20) not null,ssx varchar(10) ...原创 2019-03-20 11:56:51 · 460 阅读 · 0 评论 -
Mysql学习笔记-ch5-连接练习
– SQL的四种连接查询– 内连接inner join 或者 join– 外连接1,左连接 left join 或者left outer join2,右连接 right join 或者 right outer join3,完全外连接 full join 或者 full outer join– 创建两个表:create database testJoin;person表id,n...原创 2019-03-20 11:57:47 · 123 阅读 · 0 评论 -
Mysql学习笔记-ch6-事务
– mysql 事务– mysql中,事务其实是一个最小的不可分割的工作单元,事务能够保证一个业务的完整性。比如我们的银行转账:a -> 100update user set money=money-100 where name="a";b -> 100update user set money=money+100 where name="b";– 实际的程序中,如果...原创 2019-03-20 11:58:49 · 132 阅读 · 0 评论 -
Python 漏斗图分析 之 MOOC商业数据分析作业
某工厂招聘人才,设有初试、笔试、面试3个连续环节,各环节的通过率分别为60%、70%、80%,求招聘的平均通过率。请用适当的形式描述计算过程。解答:招聘的平均通过率,即所有人最终的通过率,结论为33.6%,约等于34%。用Python来描绘漏斗图。一、先在Excel表中输入相关数据,如下。并保存命名为“chartfunnel_data”。招聘环节 单一环节通过率 总体通过率初试 60%...原创 2019-03-20 22:01:57 · 2990 阅读 · 0 评论 -
Python之MOOC条件编程作业
编写一个输入分数,输出分数等级的程序,具体为:Score Grade90~100 A70~89 B60~69 C0~59 Dothers Invalid score请添加必要的输入输出语句,尽量让程序友好。 score = eval(input("enter the score: ")) if 0 <= score <= 100: if 90 &...原创 2019-03-22 00:29:28 · 1379 阅读 · 0 评论 -
Python之MOOC循环编程作业
将一个正整数分解质因数。例如:输入90,打印出90 = 2 *3 * 3 * 5。from math import sqrtwhile 1: n = int(input('Enter a number: ')) print(n, '=', end = ' ') i = 2 k=int(sqrt(n)) while 1: for i i...原创 2019-03-22 14:38:05 · 274 阅读 · 0 评论 -
Mysql学习笔记-ch1-数据记录常见操作
– mysql 学习笔记– 关系型数据库– 一、如何使用终端操作数据库?cd C:\Program Files\MySQL\MySQL Server 5.7\bin– 1、如何登陆数据库服务器?win:~mysql -u root -p123456C:\Program Files\MySQL\MySQL Server 5.7\bin>mysql -u root -pEnter ...原创 2019-03-20 11:50:52 · 268 阅读 · 0 评论