自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 Pandas | 频数统计使用value_counts的五个技巧

原文地址:https://mp.weixin.qq.com/s?__biz=MzAwNjA0MTE0NA==&mid=2247485696&idx=1&sn=2e87f97fc4c976f09de3db482391cb8e&chksm=9b123257ac65bb41c64a7e2320407315dd871255c558fcc97ce2bb90d3952259...

2020-01-08 16:42:22 1503 1

转载 pyspark实现多文本分类问题

原文链接:https://www.cnblogs.com/cymx66688/p/10699018.html原文链接:https://cloud.tencent.com/developer/article/1096712"""我们的任务,是将旧金山犯罪记录(San Francisco Crime Description)分类到33个类目中。输入:犯罪描述。输出:类别。""...

2019-09-18 13:42:23 1258

原创 面试和笔试时遇到的一些题。

1、java中final关键字的特点?在Java中,final关键字可以用来修饰类、方法和变量(包括成员变量和局部变量)。下面就从这三个方面来了解一下final关键字的基本用法 1》 当用final修饰一个类时,表明这个类不能被继承。也就是说,如果一个类你永远不会让他被继承,就可以用final进行修饰。 2》final修饰的方法表示此方法已经是“最后的、最终的”含义,亦即此方法...

2019-09-03 22:25:10 205

原创 Bitvise ssh client工具

公司最近新买了一台服务器,有时候跑模型在自己电脑上跑不下来,需要用到GPU,就在服务器上跑模型。而我的是window电脑,需要下载ssh连接工具,连接上远程的服务器,所以在网上找类似的工具,最后发现了BvSshClient。Secure CRT第一个使用的工具是Secure CRT,可以正常的连接服务器,也可以通过rz 命令上传文件,但不知道怎么从服务器上把文件拉到本地电脑上。下载链接在此...

2019-08-27 14:59:27 17363 12

原创 飞机大战项目-使用pycharm时遇到的问题

今日想练习下飞机大战的项目.在Ubuntu系统上安装了一个Pycharm.(1)调节字体大小File----settings-----Editor-----Font-----即可调节字体大小(2)在建立一个项目时,发现没有python解释器,所以一直没有办法运行File---settings---选择项目projects-----projectinterpreter---选择已...

2019-05-22 01:41:36 1238

原创 mysql高级

1、视图视图就是一条SELECT语句执行后返回的结果集,视图是对若干张基本表的引用,一张虚表,查询语句执行的结果,不存储具体的数据(基本表数据发生了改变,视图也会跟着改变)1、定义视图 建议以v开头create view 视图名称 as select语句;2、查看视图 查看表会将所有的视图也列出来show tables;3、使用视图视图的用途就是查询s...

2019-03-31 14:45:21 76

原创 SQL语句的查询操作(二)

-- 数据的准备 -- 创建一个数据库 create database python_test charset=utf8; -- 使用一个数据库 use python_test; -- 显示使用的当前数据是哪个? select database(); -- 创建一个数据表 -- students表 create ta...

2019-03-29 18:45:14 1181

原创 SQL语句的基本操作(一)

关于SQL语句的操作主要分为两个部分,第一部分就是大致介绍数据库、数据表的基本操作,包括增删改查;由于平时用到的基本上都是数据表的查询操作,所以第二部分重点介绍数据表的查询语句。-- 数据库的操作 -- 链接数据库 mysql -uroot -p mysql -uroot -p密码 -- 退出数据库 exit/quit/ctrl+d ...

2019-03-29 18:44:55 1946

原创 python中的正则表达式

在python中用正则表达式对字符串进行匹配的时候可用使用re模块首先需要导入re模块: import re使用过程如下:# 导入re模块import re# 使用match方法进行匹配操作result = re.match(正则表达式,要匹配的字符串) # 如果上一步匹配到数据的话,可以使用group方法来提取数据 result.group()1、单字符匹配...

2019-03-27 11:41:15 232

原创 机器学习ML中提到的几个知识点

机器学习分为无监督学习、有监督学习和强化学习(强化学习与环境进行交互,不断有反馈)。无监督学习就是没有类标签,常有的算法为聚类、降维(PCA);有监督学习有类标签,分类和回归都属于有监督学习。本文主要介绍机器学习中的几个知识点,便于了解。1、损失函数(loss function)      损失函数(loss function)是用来度量模型的预测值与真实值的不一致程度,是一个非负实值函数...

2019-01-16 21:11:54 413

原创 简单的一个爬虫抓取案例:以链家网租房信息为例

我们用到的数据有时候不是现成的,需要从网上爬取。python提供了很好的爬虫包,有requests、BeautifulSoup. scrapy。以前有接触过爬虫,但没有完整的实现一个案例,今天再七月在线上看到了一个寒小阳老师关于数据获取和处理的视频,就想着拿个例子来练练手

2018-11-14 18:51:55 4678 3

原创 用R语言实现文本挖掘(tm)、聚类

最近因为写毕业论文,想要找找怎样能够识别不相干方法评论,结果看到了R语言中使用K-mean聚类,可以查看不在聚类范围类的,输出异常的评论。由于K-mean聚类是针对数值型数据的,所以在运用K-mean聚类算法对文本进行主题聚类时,需要经历分词、词向量、文档-词矩阵等,用到了几个包。我原先针对这部分的文本分析主要时用Python中的结巴工具分词、提出关键词、LDA主题分类等方法。今天想要试试用R语言...

2018-11-13 16:44:50 8051 9

原创 社交网络分析(igraph)

社交网络算法可以识别强关系网络,若关系网络;基于好友关系为用户推荐商品或内容;社交网络中人物影响力的计算;金融行业中的反欺诈预测等等方面。安装igraphpip install -U python-igraph如果出现了错误,可以先下载下来,再安装:http://www.lfd.uci.edu/~gohlke/pythonlibs/pip install wheelpip i...

2018-11-06 21:14:11 8796

tm_0.6-2.zip

R语言做中文文本处理所用到的TM包 0.6版本,可以手动安装。

2018-11-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除