自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 中文文本预处理--未完

中文数据预处理读取文件清理文本中的 标点结巴分词目前总体的代码读取文件文本读入,可能也是一道小小的阻碍,将结果记录一下第一种方法是一次性读取,速度快try:#读取文件,并进行关闭,一次性读取 file=open('C:/Users/惠普/Desktop/2020.txt','r',encoding='UTF-8')#路径是自己设置的 data=file.read() #print(data)finally: if file: file.close()

2021-03-16 21:13:14 199

翻译 R语言实现LDA算法(鸢尾花)

R代码链接: link.亲测有效下面展示一些 内联代码片。install.packages("MASS")library(MASS)nx = 150irisdata = iris[1:nx, 1:4]irisgrp = iris[1:nx, 5](lda.sol = lda(irisdata, irisgrp))下面展示一些 内联代码片。result = predict(lda.sol, irisdata)table(irisgrp, result$class) #$class是

2021-02-27 16:18:42 6474

翻译 LDA优于PCA情况

两种方法各有优缺在有标签的情况下,选择LDA是比较好的下面展示一些 内联代码片。import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn.datasets.samples_generator import make_classificationfrom sklearn.decomposition import PCA##导入PCA库from skle

2021-02-24 21:17:08 194

翻译 LDA---鸢尾花数据集

LDA实现话不多说。直接来代码吧整理的比较简单,记录自己的学习过程下面展示一些 内联代码片。import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfrom sklearn.preprocessing import LabelEncoderfrom sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDAfeatur

2021-02-24 21:08:23 1353

翻译 R语言实现PCA降维

R代码实现PCA降维过程链接: http://blog.sciencenet.cn/blog-3448646-1270918.html数据集是经典的鸢尾花做简单的记录,只附代码和结果,下面展示一些 内联代码片。具体自行操作,可交流install.packages("ggplot2")library(ggplot2)df <- iris[c(1, 2, 3, 4)]head(df)df_pca <- prcomp(df) #计算主成分df_pcs <-data.fra

2021-02-20 10:01:49 2583

翻译 PCA和LDA鸢尾花实现

PCA运行结果没有粘贴,自行操作哦下面展示一些 内联代码片。##用于3D可视化from mpl_toolkits.mplot3d import Axes3D##用于可视化图表import matplotlib.pyplot as plt##用于做科学计算import numpy as np##用于做数据分析import pandas as pd##用于加载数据或生成数据等from sklearn import datasets##导入PCA库from sklearn.decomp

2021-02-17 21:50:16 336

原创 用代码给你“笔芯”

花样表白学着点????????????????????你以为的笔芯图片来源于网络,侵删也可以这样下面展示一些简单的 代码。import numpy as npimport matplotlib.pyplot as pltX = np.arange(-4.0, 4.0, 0.1)#可以自己设置Y = np.arange(-4.0, 4.0, 0.1)x, y = np.meshgrid(X, Y)f = 18 * x ** 2 - 16 * np.abs(x) * y + 18

2021-01-13 20:34:59 464 1

原创 运用citespace做分析流程

citespace真真的是个大魔王,从开始下载安装给我下马威到现在操作,哈哈哈哈❤????????????????????学习一点,记录一点我皮加油加油基本流程除了基本流程还有一般分析的内容????????????整理有点草率,哈哈哈下次把操作过程附带上面????...

2021-01-10 15:54:04 1060

原创 给文本去噪

在做文本分析时,会有很多的“噪声”例如表情,一连串的标点符号等等所以在分析之呢,要给文本洗洗澡????正则清洗一般是用正则表达式,对文本进行清洗话不多说,上代码喽下面展示一些 代码片。import refrom gensim import corpora,modelsimport jiebaimport pandas as pd# jieba.cut 生成generator# 全模式分词# 加载自定义词典text = u'''你“你不用去哪里,世界奔你而来。”????????

2021-01-08 21:06:44 3814 3

翻译 LDA那些事

#LDA新尝试邮箱topic开心呀,要转换成处理中文,再建立LDA模型是还有很长的路要走呀邮箱topic这个是大神的代码,跑通不易,皮皮小白记录历程链接: link.向作者大大致敬,么么么么❤❤❤❤❤❤❤(小白弱弱的说一句,如果侵权了,联系我删哦)下面展示一些 代码。import numpy as npimport pandas as pdimport redf = pd.read_csv("HillaryEmails.csv")# 去掉原邮件数据中Nan值。df = df[['

2020-12-31 19:21:07 187

原创 NLP--读取号码归属

嘻嘻嘻,记录自己的学习吧顺便保存运行过的代码嘿嘿嘿,对于小白来讲,能跑通几行代码就感觉自己好棒呀用python读取号码归属真的很好玩哦链接:下面展示一些 代码片from phone import Phonem = Phone()m.find(1822456065!)``{'phone': '1822456065!', 'province': '河南', 'city': '新乡', 'zip_code': '453000', 'area_code': '0373', 'p

2020-12-31 15:01:07 199 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除