项目记录
Spratumn
行动派
展开
-
一个简单的PyQt5小程序
以前学习PyQt5的时候做过的一个小程序,现在也把它整理上来。这是运行时的主界面主要功能类似与常用的看图软件,因为最初我的想法是把他做成一个功能比较类似PS的软件,所以当时名字设成了MyPS,结果仅仅完成了九牛一毛。。。以下是完整代码:1.CVshopmainwindow.py从designer设计界面,转成的代码。主要是定义了主窗口以及一些信号槽# -*- coding: utf...原创 2019-09-05 19:53:39 · 1117 阅读 · 0 评论 -
华为5g微博词云
1.爬取微博数据首先,从微博爬取以“华为5g芯片”为关键词搜索的微博,并将数据整理写入数据库。import requests as reimport timeimport pandas as pdimport pymysql# 手动搜索后获得的url,用于后面的爬取多页的微博数据target_url = "https://m.weibo.cn/api/container/getInd...原创 2019-09-07 20:33:27 · 996 阅读 · 1 评论 -
Kaggle幼苗分类训练
图片预处理import cv2 as cvimport numpy as npfrom random import randintclass ImageProcessor: def __init__(self): pass def load_image(self,image_path, image_width=224, is_augment=False, r...原创 2019-09-02 21:03:15 · 405 阅读 · 0 评论 -
微博爬虫及舆情分析-1.爬取微博数据
本文以“Mate30”为关键字进行分析import requests as reimport time#搜索关键字Mate30并获取urltarget_url = "https://m.weibo.cn/api/container/getIndex?containerid=100103type%3D1%26q%3DMate30&page_type=searchall&pag...原创 2019-09-15 14:44:16 · 9791 阅读 · 27 评论 -
微博爬虫及舆情分析-2.用户分析
import pandas as pdimport re#读取数据user_frame = pd.read_csv('users.csv',index_col=None)user_frame.head(2)# 我用的是notebook所以这里只有截图发上来# location字段整理,保留到省份user_frame['location']=user_frame.location.f...原创 2019-09-15 14:45:13 · 2396 阅读 · 0 评论 -
微博爬虫及舆情分析-3.文本清理与制作词云
1、文本清理import pandas as pdimport pymysqlfrom sqlalchemy import create_engineimport reimport jiebaimport jieba.analyse#1.从数据库导入微博数据并查看mblog_frame = pd.read_csv('mblog.csv',index_col=None)mblog_...原创 2019-09-15 14:54:45 · 3183 阅读 · 3 评论 -
微博爬虫及舆情分析-4.用户舆情分析
import pandas as pdimport numpy as np#读取训练数据集mblog=pd.read_csv('clean_mblog.csv',encoding='utf_8_sig')mblog.head()import jieba.analysedef get_keywords(raw): if raw['isLongText'] == 1: ...原创 2019-09-15 15:01:03 · 7379 阅读 · 4 评论