- 博客(39)
- 收藏
- 关注
原创 python中字符串的join()函数的用法
用法一:字符串类型:str="abcd"print("_".join(str))运行结果为:用法二:元组类型:tuple=('a','b','c','d')print("_".join(tuple))运行结果为:用法三:列表类型:list_01=['a','b','c']print('_'.join(list_01))运行结果:...
2022-02-16 21:23:54 2716
原创 dataframe求两列的相乘,再将输出为新的一列
df["new"]=df3["rate"]*df3["duration"]new为新的一列的列名rate和duration为需要相乘的列加,减,乘,除都适用!
2020-12-29 09:26:30 8350 3
转载 数组和链表区别
谈到链表与数组的区别,可以从几个不同的角度来谈,首先从逻辑结构上说,两者都是数据结构的一种,但存在区别,数组是申请的一块连续的内存空间,并且是在编译阶段就要确定空间大小的,同时在运行阶段是不允许改变的,所以它不能够随着需要的改变而增加或减少空间大小,所以当数据量大的时候,有可能超出了已申请好的数组上限,产生数据越界,或者是数据量很小,对于没有使用的数组空间,造成内存浪费。链表则是动态申请的内存空间,并不像数组一样需要事先申请好大小,链表是现用现申请就OK,根据需求动态的申请或删除内存空间,对于的是增加
2020-11-23 15:07:56 411
原创 用朴素贝叶斯算法对sklearn自带的新闻进行分类
from sklearn.datasets import fetch_20newsgroupsfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.naive_bayes import MultinomialNBfrom sklearn.model_selection import train_test_splitdef nb_news(): #1)加载数据 news=fetch_20newsg
2020-11-23 09:30:41 577
原创 session和Cookie两种技术的区别与联系
session是借助Cookie实现的,sessionId就是通过Cookie对象保存到客户端的(对象名为JESSIONID,对象值为sessionId),客户端向服务器发出请求时,服务器可以从Cookie对象中获得sessionId从而识别用户身份。保存sessionId的Cookie对象存在于客户端的内存中,当浏览器关闭时,sessionId就会丢失,导致服务器无法获取而使session失效。而一般的Cookie对象可以通过设置有效时间(sexMaxAge(int expiry))以文件的形式保存到.
2020-11-22 23:01:40 198
原创 servlet跳转到JSP页面的两种方法
servlet调用jsp,有两种方式:转向和重定向转向:是在一个Web工程内部,各组件之间的调用。在调用时,request对象中的信息不会丢失(request对象不消亡),进入另一个组件后,request对象中的数据可以在新组件继续使用。重定向:可以在一个Web工程内部,各组件之间实现调用,也可以直接跳转到其他Web工程的Jsp页面。并且,在跳转到新组件后,重新创建request对象。转向:在servlet中实现转向,需要有请求对象(HttpServletRequest request)获得一个转发
2020-11-22 18:03:20 7866
原创 idea在不重新启动tomcat服务,实现修改servlet代码自动更新
1.首先修改tomcat的server.xml文件,该文件在apache-tomcat-9.0.38\conf这个文件下面。2.找到下面这句话,添加reloadable=“true”3.开启tomcat的debug模式即可!
2020-11-22 17:37:12 682
原创 javaweb项目中连接mysql导入驱动包
1.右键项目,点击 open module settings2.点击图中的加号,再点击jars or directries3.找到mysql驱动包4.最后点击apply,再点击ok即可
2020-11-21 11:03:25 2786
原创 jsp对数据库中的满足条件的数据进行修改
先设计条件界面,如下图所示对应的jsp代码如下<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8" %><html><head> <title>按照条件修改数据库中的内容</title></head><body><form action="lianxi24.jsp" method=
2020-11-16 14:37:20 1664
原创 jsp实现按照条件查询数据库中的内容并把用表格输出
首先设计查询的页面:(如下图所示)对应代码为:<%@ page import="java.sql.Connection" %><%@ page import="java.sql.DriverManager" %><%@ page import="java.sql.PreparedStatement" %><%@ page import="java.sql.ResultSet" %><%@ page language="java" conte
2020-11-14 22:29:29 5504 1
原创 用python在windows下连接ubuntu下的mysql
1.一root用户登陆MySQLmysql -u root -p2.执行以下命令:grant all privileges on *.* to root@'%' identified by '密码';解释:'all privileges ':所有权限. 所有库的所有表 如 databasename.*。% 所有IPidentified by ‘密码’ 表示通过密码连接3.刷新一下权限:flush privileges;4.修改一下配置文件:在ubuntu下为/etc/mysq
2020-06-11 13:11:33 367
转载 Hive中提示Expression Not In Group By Key的解决办法
问题出现的原因:1.Hive不允许直接访问非group by字段;2.对于非group by字段,可以用Hive的collect_set函数收集这些字段,返回一个数组;3.使用数字下标,可以直接访问数组中的元素;MySQL中代码:select d.dname,count(*) num from emp e join dept d on e.deptno=d.deptno where e.sal<=2500 group by e.deptno order by num desc lim
2020-06-09 09:39:04 2846
原创 解决hive报错FAILED: SemanticException Cartesian products are disabled for safety的问题
1.先看问题:FAILED: SemanticException Cartesian products are disabled for safety reasons. If you know what you are doing, please sethive.strict.checks.cartesian.product to false and that hive.mapred.mode is not set to ‘strict’ to proceed. Note that if you may
2020-06-05 15:59:27 3919 1
原创 Jupyter notebook文件默认存储路径以及更改方法
1.安装Anaconda后,新建文件的默认存储路径一般在C系统盘,那么路径是什么呢?首先先打开jupyter Notebook ,再点击new,再点击Python3.接着输入以下命令:import osprint(os.path.abspath('.'))再运行会出现一个路径2.修改该路径,在开始菜单中找到Anaconda Prompt 打开输入以下命令:jupyter notebook --generate-config根据上面运行处的路径打开C:\Users\HS.jupyt
2020-06-03 11:34:18 5296 4
原创 通过JavaAPI访问zookeeper
package org.example;import org.apache.zookeeper.*;import org.apache.zookeeper.data.Stat;import org.junit.Before;import org.junit.Test;import java.io.IOException;import java.util.List;public class ZkClient { private ZooKeeper zkCli; private
2020-05-31 19:28:04 262
原创 Flume采集数据到HDFS时,生成的文件中,开头信息有乱码
需要修改一下配置文件的信息原配置文件:a1.sources = r1a1.sinks = k1a1.channels = c1#配置Sourcea1.sources.r1.type=syslogtcpa1.sources.r1.port = 5140a1.sources.r1.host = localhost#配置Sinka1.sinks.k1.type = hdfsa1.sinks.k1.hdfs.path = hdfs://localhost:9000/user/node01/fl
2020-05-27 09:59:42 242
原创 sqoop报错Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR 的解决方法
检查HIVE_CONF_DIR是否有设置:echo $HIVE_CONF_DIR如果输出为空。则是没有设置HIVE_CONF_DIRvi ~/.bashrc加入以下配置export HIVE_CONF_DIR=$HIVE_HOME/conf使之生效source ~/.bashrc再将hive里面的lib下的hive-exec-**.jar放到sqoop的lib下就可以解决问题cp ~/hive/lib/hive-exec-2.3.3.jar ~/sqoop/lib...
2020-05-26 10:04:57 508 1
原创 使用多个文件练习:分别在当前目录中手动创建4个文本文件,名字分别命名为:毕业的日子.txt,最平凡处最美丽.txt,花开如笑.txt。分别读取每一个文本文件,统计文件中的句子数量。使用异常模块来处理读
直接上代码list = ["d:\桌面上的文件\毕业的日子.txt" , "d:\桌面上的文件\最平凡处最美丽.txt"]for filename in list: with open(filename , "r") as file: count = 0 comment = file.read() for i in comment: ...
2020-05-04 16:38:48 515
原创 在当前目录新建目录img, 里面包含100个文件,100个文件名各不相同(X4G5.png),将当前img目录所有以.png结尾的后缀名改为.jpg
直接上代码import osimport randomimport stringdef mkdir(): os.mkdir("d:\桌面上的文件\img") print("文件夹创建成功")mkdir()def gen_code(): list = random.sample(string.ascii_letters + string.digits , 4) ...
2020-05-03 21:54:22 1050
原创 python代码来操纵Mongodb
1)首先先安装第三方库 pip install pymongo ‐i https://pypi.tuna.tsinghua.edu.cn/simple2)使用Python脚本模拟较大量数据import pymongofrom uuid import uuid4import randomconn_str = "mongodb://localhost:27017/"client = p...
2020-04-29 14:39:35 145
原创 生成一个大文件ips.txt,要求1200行,每行随机为172.25.254.0/24段的ip;读取ips.txt文件统计这个文件中ip出现频率排前10的ip
直接上代码import randomfrom collections import Counterfilename = "d:/桌面上的文件/ips.txt"ip = "172.25.254"list = []with open(filename , "a+") as file: for i in range(1200): file.write(str(ip +...
2020-04-29 11:46:22 988
原创 Python在终端通过pip安装好包以后在Pycharm中依然无法使用的问题
首先打开pycharm,在点击file,再点击setting,接着如下图所示:等待安装即可
2020-04-28 18:20:36 388 1
原创 编写一个程序,提示用户输入其名字,用户作出响应后,将其名字累加写入到文件guest.txt中,同时打印guest.txt文件记录的名字,当输入‘n’时,输入名字程序退出。
代码如下:while True: #先写一个while循环 name = str(input("请输入你的名字:")) if name == "n": print("程序结束。") break else: filename = "d:/桌面上的文件/guest.txt" with open(file...
2020-04-28 14:10:20 4119
原创 创建文件data.txt,共100000行,每行存放一个1~100之间的整数
1)这道题主要是练习文件的读写与异常综合2)代码实现:import random #导入随机变量模块filename = "d:/桌面上的文件/data.txt" #首先创建一个文件名字为data.txtwith open(filename , "w") as file: #用with as 方法打开这个文件 for i in range(100000): #做一个循...
2020-04-28 12:04:56 6391 3
原创 Python面向对象练习-士兵开枪问题
1)需求:1.士兵瑞恩有一把AK472.士兵可以开火(士兵开火扣动的是扳机)3.枪能够发射子弹–把子弹发射出去4.枪能够装填子弹–增加子弹的数量2)分析:由于士兵瑞恩有一把AK47,士兵可以开火。故应该创建两个类:一个是士兵类,一个是枪类枪类(Gun):(1)属性:型号(model),弹夹中子弹的数目(bullet_count)(2)方法:射击子弹(shoot),添加子弹(add...
2020-04-18 11:44:12 4733
原创 使用MapReduce求出各年销售笔数、各年销售总额
1)将上面的数据文件上传到hdfshdfs dfs -put sales.csv /input/2)采用Eclipse/IDEA创建一个Maven工程,同时修改pom.xml文件,增加dependencies,/dependencies、build,/build节点,内容如下: <dependency> <groupId>org.apache.ha...
2020-04-01 18:16:20 7368 15
原创 分析和编写WordCount程序
1)采用Eclipse/IDEA创建一个Maven工程2)修改pom.xml,增加dependencies,/dependencies、build ,/build节点,如下:增加依赖 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hado...
2020-03-26 19:37:53 1804 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人