Nano皮-CSDN博客

原创中文文本预处理--未完

中文数据预处理读取文件清理文本中的标点结巴分词目前总体的代码读取文件文本读入，可能也是一道小小的阻碍，将结果记录一下第一种方法是一次性读取，速度快try:#读取文件，并进行关闭，一次性读取 file=open('C:/Users/惠普/Desktop/2020.txt','r',encoding='UTF-8')#路径是自己设置的 data=file.read() #print(data)finally: if file: file.close()

2021-03-16 21:13:14 199

翻译 R语言实现LDA算法（鸢尾花）

R代码链接: link.亲测有效下面展示一些内联代码片。install.packages("MASS")library(MASS)nx = 150irisdata = iris[1:nx, 1:4]irisgrp = iris[1:nx, 5](lda.sol = lda(irisdata, irisgrp))下面展示一些内联代码片。result = predict(lda.sol, irisdata)table(irisgrp, result$class) #$class是

2021-02-27 16:18:42 6474

翻译 LDA优于PCA情况

两种方法各有优缺在有标签的情况下，选择LDA是比较好的下面展示一些内联代码片。import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn.datasets.samples_generator import make_classificationfrom sklearn.decomposition import PCA##导入PCA库from skle

2021-02-24 21:17:08 194

翻译 LDA---鸢尾花数据集

LDA实现话不多说。直接来代码吧整理的比较简单，记录自己的学习过程下面展示一些内联代码片。import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfrom sklearn.preprocessing import LabelEncoderfrom sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDAfeatur

2021-02-24 21:08:23 1353

翻译 R语言实现PCA降维

R代码实现PCA降维过程链接: http://blog.sciencenet.cn/blog-3448646-1270918.html数据集是经典的鸢尾花做简单的记录，只附代码和结果，下面展示一些内联代码片。具体自行操作，可交流install.packages("ggplot2")library(ggplot2)df <- iris[c(1, 2, 3, 4)]head(df)df_pca <- prcomp(df) #计算主成分df_pcs <-data.fra

2021-02-20 10:01:49 2583

翻译 PCA和LDA鸢尾花实现

PCA运行结果没有粘贴，自行操作哦下面展示一些内联代码片。##用于3D可视化from mpl_toolkits.mplot3d import Axes3D##用于可视化图表import matplotlib.pyplot as plt##用于做科学计算import numpy as np##用于做数据分析import pandas as pd##用于加载数据或生成数据等from sklearn import datasets##导入PCA库from sklearn.decomp

2021-02-17 21:50:16 336

原创用代码给你“笔芯”

花样表白学着点????????????????????你以为的笔芯图片来源于网络，侵删也可以这样下面展示一些简单的代码。import numpy as npimport matplotlib.pyplot as pltX = np.arange(-4.0, 4.0, 0.1)#可以自己设置Y = np.arange(-4.0, 4.0, 0.1)x, y = np.meshgrid(X, Y)f = 18 * x ** 2 - 16 * np.abs(x) * y + 18

2021-01-13 20:34:59 464 1

原创运用citespace做分析流程

citespace真真的是个大魔王，从开始下载安装给我下马威到现在操作，哈哈哈哈❤????????????????????学习一点，记录一点我皮加油加油基本流程除了基本流程还有一般分析的内容????????????整理有点草率，哈哈哈下次把操作过程附带上面????...

2021-01-10 15:54:04 1060

原创给文本去噪

在做文本分析时，会有很多的“噪声”例如表情，一连串的标点符号等等所以在分析之呢，要给文本洗洗澡????正则清洗一般是用正则表达式，对文本进行清洗话不多说，上代码喽下面展示一些代码片。import refrom gensim import corpora,modelsimport jiebaimport pandas as pd# jieba.cut 生成generator# 全模式分词# 加载自定义词典text = u'''你“你不用去哪里，世界奔你而来。”????????

2021-01-08 21:06:44 3814 3

翻译 LDA那些事

#LDA新尝试邮箱topic开心呀，要转换成处理中文，再建立LDA模型是还有很长的路要走呀邮箱topic这个是大神的代码，跑通不易，皮皮小白记录历程链接: link.向作者大大致敬，么么么么❤❤❤❤❤❤❤（小白弱弱的说一句，如果侵权了，联系我删哦）下面展示一些代码。import numpy as npimport pandas as pdimport redf = pd.read_csv("HillaryEmails.csv")# 去掉原邮件数据中Nan值。df = df[['

2020-12-31 19:21:07 187

原创 NLP--读取号码归属

嘻嘻嘻，记录自己的学习吧顺便保存运行过的代码嘿嘿嘿，对于小白来讲，能跑通几行代码就感觉自己好棒呀用python读取号码归属真的很好玩哦链接:下面展示一些代码片from phone import Phonem = Phone()m.find(1822456065！)``{'phone': '1822456065！', 'province': '河南', 'city': '新乡', 'zip_code': '453000', 'area_code': '0373', 'p

2020-12-31 15:01:07 199 2

Nanopipi的博客