自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 TypeError: ‘NoneType‘ object is not iterable

目录1.TypeError: 'NoneType' object is not iterable 原因:data 内容为空1.2 挑选头条里的几个人物,发现还挺有意思的。建议文案工作者爬爬数据,就看看文案也蛮好的。2.现在进行测试:手动更改参数格式vs利用notepad++列模式更改2.1 个人猜测是tab键的原因2.2于是自己开始大胆假设,小心求证, 发现显示space和tab 键, 数字之间空余的都是space,说明不关tab的事3. 总结:机器在识别的过程中,对特定标签有要求.

2021-04-10 21:58:50 14189 6

原创 Python 爬虫 前端学习(一)

目录 1.前端的组成 1.1.内容从何而来? 1.2.怎样添加内容? 1.3Chrome 浏览器作为爬虫的页面分析工具2.Request 讲解:3.网络爬虫的基本构成 (GET/POST) 3.1.网络请求 3.2.静态爬虫 和 动态爬虫 3.3.Requests 构建请求 3.4.cookie 和session1.前端的组成 1.1.内容从何而来? ...

2021-04-09 23:21:49 500

原创 Python 爬虫 学习(一)

目录1.Python系统环境安装 & Pycharm1.2 导入python相应的库(使用阿里镜像源)2python语法基础 2.1基础数据类型 & 多元数据类型 2.2逻辑与循环2.3函数2.4迭代器 & 生成器 a={1,2,3,4........}2.5多线程1.Python系统环境安装 & Pycharmpython官网下载界面挺好看的系...

2021-04-09 23:06:59 157

原创 电影推荐系统(四)

1.创建Maven项目,依赖导入的问题解决方案: Scala的jar包问题可以关注自己的jdk是否符合JDK 11JDK 8解决方案一:解决方案二推荐博主https://blog.csdn.net/fanrenxiang/article/details/808649082.Ubuntu 和 Windows 双向传递已经开启,但是仍旧显示不能copy文件解决方案: 重启后,尝试重新传输...

2021-04-08 07:54:00 578 2

原创 Xml&Json

目录网络数据传输 为什么学习xml?SAX (逐行驱动)DOM 解析方式 支持Xpath:books//book//namelib导入jar包却无法编译?DOM 4j - XPATH解析 XML聚合数据 JSON: JavaScript (和大哥Java没有关系,只是蹭Java热度)Json 解析匿名对象方法 toJsonHashMap中的page看似为数组,实则是ArrayListFast Json...

2021-04-06 21:22:19 145 1

原创 电影推荐系统三

目录1.面对高端技术,心态调节:机器学习,算法等无需先犯怵。就把它想象成更高级的轮子,先会使用。2.Spark Mlib运行起来有太多无关紧要的信息 第二步,对比显性(基于评分)与隐性(基于用户的意见,点击,购买,喜爱,分享等实际操作)第三步,均方差根越小,与实际结果更加相符。可以看到Explicit(显性)此轮与结果更加相符。4.使用Express框架和Jade模板引擎5.创建服务器ReferenceError: _dirname is not defined6.un...

2021-04-05 22:07:10 537

原创 《大数据实训 电影推荐系统》系列2

目录理论支持 :《大数据实训 电影推荐系统》 林子雨1.免密登录配置2.启动Hadoop报错3.产生报错 JAVA_HOME NOT FOUND 找到要修改JAVA_HOME的配置文件全修改4.目标:Spark可以奔跑出数据,hive,zookeepre 也很重要,和目标关联不大,不执行配置操作。5.Spark-shell 作为交互式解释器的强大之处在于,立即执行,及时反馈。6.mysql中的乱码解决方案:7.ETL工具Kettle完成对数据上传到...

2021-04-04 21:58:53 4623 5

原创 Virtual Box进行Ubuntu搭建问题集锦,电影推荐教程系列(一)

1.林子雨老师的电影推荐教程系列(一)http://dblab.xmu.edu.cn/blog/337-2/2.无法进行复制粘贴请看此处法一:https://blog.csdn.net/weixin_44532220/article/details/102739335法二:需科学上网sudo apt-get install virtualbox-guest-utilshttps://askubuntu.com/questions/573596/unable-to-install-guest-

2021-04-03 21:45:47 458

原创 Caused by: java.sql.SQLException: null, message from server: “Host ‘allen‘ is not allowed to connec

启动metastore的报错Caused by: java.sql.SQLException: null, message from server: “Host ‘allen’ is not allowed to connect to this MySQL server”检查配置文件 hive-site.xml 是否和MySQL中的host user名称相互对应hive中启动hive --service metastore &加载成功...

2021-04-02 16:09:13 2184

原创 多线程及线程池

多线程基本概念进程:类似一个软件线程:软件中的执行路径线程调度我们说4核也好,8核也好,这是对计算机更合理的分配,比如一个????(cpu),它运行的很快,同一段时间做很多事情,但是他仍旧是每次只做一件事。打个比方:一人一年,写书,创业,旅游,恋爱。我们需要了解的是计算机的处理速度是远快于人的。所以人需要学会灵活运用计算机的算力,锻炼自己如何学习架构一个完备的软件能力,而不是和计算机拼手速。再举一个栗子:1000人 8个岗位1.不排队,就是切换2.排队,轮流做哪个更加有效率?试

2021-03-28 17:15:12 472 2

原创 Java核心类库整理

我们可以看到最上面一层是Iterator,Collection,Map(键值对的形式,key,value)Collection下一层是List,Set,Queue接下来我们依次介绍:Vector1.同步访问,多线程访问的时候是安全的(我们需要区别list在多线程访问是不安全的)举个栗子:高中众人狂奔去食堂:多线程,不安全list (户外视野开阔,效率第一)在食堂每个人排队打饭:多线程,安全vector(食堂空间狭小,安全第一)2.包含许多传统方法,不属于集合框架源码设置:默认值:10.

2021-03-20 20:12:25 240

原创 代码精进之路

以前照着代码打,说不理解,也能跟得上思路;要说理解,自己打两行就歇。鸡血可贵,方法,努力,坚持也都很宝贵。‘我目前代码学习方法是这样的:第一遍:看视频学习后同时自己大致写好思路,准备开干。写好与原文档对比,截图写好错误原因保存方便复盘,然后缩小正确文档,自己改写。第二遍:再次拿出原文档比较,自己改正,大致操作如步骤一。我的学习机理:刻意练习,分为四步:目标,专注,反馈,修正。目标:就是掌握文件遍历查询专注:就是一次做好一件事,别老想着跟着老师把代码打好就成,大二,大 三我就是大多数时候无脑

2021-03-19 12:47:17 190 4

原创 计算机打开虚拟机,电脑就蓝屏

Q:计算机打开虚拟机,电脑就蓝屏A:可能之一,镜像文件不完整或者不存在。我的镜像在移动硬盘里,打开虚拟机总是跳蓝屏,后来下载更新iso镜像后,不再蓝屏了。

2021-03-16 08:15:04 15399 2

原创 Oracel sql基础常见问题

Oracel sql基础常见问题1.1问题:日期函数的使用 ,无效月份的问题1.2解决方案:需要更改ALTER SESSION SET nls_date_language=‘american’;2.1问题:如何将date类型更改为数字?2.2解决方案:to_number(to_char(st.D_LASTMODIFY,‘YYYYMMDD’))3.1问题:创建时有missing expression问题3.2解决方案:(1)缺失逗号,关键词等细节问题;(2) 规范性: 需要注意的是

2021-03-14 16:08:31 1410 1

原创 object flink is not a member of package org.apache & scala compiler not found

确保两点1JVM options for importer:-Didea.maven3.use.compat.resolver2JDK importer 修改成自己的问题一,object flink is not a member of package org.apache解决问题二 scala compiler not found问题二解决

2020-09-23 12:31:32 1803

原创 Retreat 闭包

源代码:def func(): app=[] #开辟新空间 def put(x): app.append(x) def get(): return app return put,get #对p数组传值,就相当于对func中数组传值p,g=func()p(1)p(2)print("数组中的数为: ",g())p(3)p(4)print("此时数组中的数又为:? ",g())C(conclu...

2020-07-30 14:05:01 165

原创 pyhon的函数嵌套 除坑

1.红色处是有误的,个人先进行排错2.根据书中提示,结合其他学习者经验排错排除错误,完成主函数嵌套函数,完成计算器的代码代码如下:def args_ABC(): try: A=float(input("请输入一个实数")) B=float(input("请输入一个实数")) C=float(input("请输入一个实数")) return A,B,C # 返回一次到位 except: ...

2020-07-30 09:45:02 174

原创 为什么显示expected an intended block?

缩进对齐知识点:python 判断结构需要对齐Q1:为什么显示expected an intended block?A1:请对逻辑体内代码对齐

2020-07-24 18:04:02 7035

原创 大数据 spark

大数据 sparkSparkcore的流程,实现pvuv计算1.data中引用的数据是20185082818,此时只需要在左边的打他中轻轻添加已经保存好的文档即可,不用再去hdfs上面去寻找数据,2.再去温习一下hdfs的功能作用。欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这...

2020-03-30 23:16:53 137

python的excel文档

python的excel文档

2022-03-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除