- 博客(3)
- 收藏
- 关注
原创 大数据项目:职务分析(一)——数据获取
项目介绍:该项目适合学习的时候使用,因为项目比较小,主要目的对猎聘当中的各个岗位的数据的获取和简单的分析,从多个方面分析岗位之间的关系以及薪资的差异。采用的技术有:python爬虫:hadoop:hdfs存储数据hive on spark : 进行数据分析sqoop: 将分析的结果传输到关系型数据库当中superset:进行数据的可视化首先是将数据从猎聘官网当中获取:爬取技术一栏当中的似是一个岗位对应的数据。先获得各个岗位的url,进行跳转,在每个网页当获取有用的
2022-01-01 21:05:01
1015
原创 python期末大作业-图形化爬虫
爬虫部分 数据库部分 ui部分 文件系统部分 数据简单分析部分结果演示:上述展示的是主页面,当点击提交的时候会进行线程的开启来进行数据的爬取,当然,在点击的时候也会有简单的检验功能,url的填写要注意格式:当写完完整的url之后有一个空格,再写要创建的表的表名。下面的两列为xpath,和其对应的表的列名。 当点击查看数据库的时候,会弹出第二个图形化,有一个下来菜单来让我们选择要查看的表,数据会在下面的表格当中显示,并且可以通过在文本框当中写入查询的sql语句来实现部分...
2022-01-01 20:59:03
3739
原创 编译原理-算符优先代码实现(java实现)
1.算符优先的概念:firstvt: 当A->a…或者A->Ba…. 的时候 将a属于Firstvt(A), 并且FirstVt(B)当中的元素也属于Firstvt(A),lastvt:当A->…a或者A->….aB 的时候,则a属于lastvt(A) ,并且LastVt(B)当中的元素,也是属于LastVt(A)的。对于A->…ac… 或者 …aBc… 的时候,a的优先级=c的优先级。算符优先表是根据表达式来决定的,当遇到形如C->A+B ,由于匹配..
2022-01-01 10:09:21
1375
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人