- 博客(6)
- 收藏
- 关注
原创 基于B站视频评论的情感分析——数据处理准备阶段
在进行数据分析之前,我先编写一个名为dataProcessing的程序包方便之后的使用 注:本文使用的是百度提供的nlp接口 源代码 import pandas as pd import jieba import wordcloud import time import random from aip import AipNlp def CreatDataFrame(file_name): with open(file_name + ".txt", "r+",encoding = "UTF-8"
2020-05-13 16:02:15
1863
2
原创 1000条京东口罩评论爬取实例
输出词云结果: 爬取思想: 1.利用request库获得目标页面的文本数据,如果目标网页对请求头有要求,利用Google浏览器获得请求头内容并添加,最后将传回的数据转化为json格式方便操作。 2.在循环爬取时加入time.sleep(random.random()*5语句防止被封 3.分词和生成词云 方法分析: 1.获得数据: 目标url的获取: url=‘https://club.jd.co...
2020-03-31 15:08:38
580
1
原创 决策树的ID3算法实现
下表是一个有关挑选西瓜的经验数据,其中分类属性是d(是否好瓜) 编号 c1(色泽) c2(根蒂) c3(敲声) c4(纹理) c5(脐部) c6(触感) d(好瓜) x1 青绿 蜷缩 浊响 清晰 凹陷 硬滑 是 x2 乌黑 蜷缩 沉闷 清晰 凹陷 硬滑 是 x3 乌黑 蜷缩 浊响 清晰 凹陷 硬滑 是 x4 青绿 蜷缩 沉闷 清晰 凹陷 硬滑 是 x5 浅白 蜷缩 浊响 清晰 凹陷 硬滑 是 x6...
2019-11-24 16:17:12
340
原创 Android studio学习:出现Could not download “XXXX” : No cached version available for offline mode
android studio版本3.0以上 出现Could not download “XXXX” : No cached version available for offline mode问题, 解决方法file->setting->gradle里面的global gradle setting 将offline work 关掉 然后rebuild一下。 ...
2019-10-16 20:17:01
746
原创 pat 1001(c语言)
pat 1001(c语言) 害死人不偿命的(3n+1)猜想 (15 分) 卡拉兹(Callatz)猜想: 对任何一个正整数 n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把 (3n+1) 砍掉一半。这样一直反复砍下去,最后一定在某一步得到 n=1。卡拉兹在 1950 年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻很天真的命题,结果闹得学生们无心学业,...
2018-10-14 21:36:38
169
原创 pat1002
#include<stdio.h> int main(){ char number[100]; char word[10][5]={“ling”,“yi”,“er”,“san”,“si”,“wu”,“liu”,“qi”,“ba”,“jiu”}; scanf("%s",&number); int b[10]={-1}; int i=0,j,m=0,n=0; int sum=0; ...
2018-10-12 22:34:07
92
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人