自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 安装pycorrector和kenlm常见错误及其解决办法

项目有用到错字识别基于Python,vc++14,kenlm、pycorrector安装中遇到不愉快点,及其解决方法分享大家,共勉首先进行pip install pycorrector直接安装可能出错1:error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build解决:就是缺少编译器安装VS工具即可,14及其以上版本都可以,(网一顿乱下,还没解决)如下提供比较边界方便。链接:https:/

2021-02-03 21:43:01 2737 2

原创 python3-爬虫-百度新闻结果

百度新闻结果爬虫1. 获取新闻结果页面内容在百度新闻搜索“清华大学”,得到页面图如下:#百度新闻搜索--清华大学#获取对应页面的所有相关信息import requestsfrom bs4 import BeautifulSoup as BSheaders={'user-agent':'xxxxxx', 'cookies':'XXXX'}#headers内容自行修改 url='https://www.baidu.com/s?ie=utf-8&medium=

2021-01-26 23:15:08 1432 4

原创 python3--pip下载LDA时出现的问题

pip下载LDA出现的问题Microsoft visual Studio14.0 or greater is required…解决办法:博客直接在 给的下载链接里面打开下载,默认安装好后就可以pip了!

2020-10-20 20:53:28 2378 1

原创 python3--opencc安装方式

尝试用gensim训练维基百科中文数据的word2vec,需要使用到opencc这个库来转换繁简体。直接 pip intall opencc-python会出错:找了好久都在说关于修改编译distribute-setup的方法,感觉对我没用,结果在这找到了这条命令,尝试了一下,结果成功了!!!https://pypi.org/project/opencc-python-reimplemented/pip install opencc-python-reimplemented...

2020-10-12 22:32:06 1279 1

原创 python3--爬虫-批量词典翻译英文单词

选择的是有道词典进行翻译英文单词网页传送门网页翻译单词页面视图:直接上代码:import requestsimport timefrom bs4 import BeautifulSoupuser_agent='XXXheaders = { 'User-Agent':user_agent }word_list=['ADULTERATION','ABOLISHING','ABSENCE']trans_list = []for item in w.

2020-10-11 17:19:47 802 5

原创 python3--爬虫--微博爬虫实战

爬取目标用户的微博写在前面:微博有三个网站,不同的网站爬取得难度不同,分别是网页端:这里写目录标题爬取目标用户的微博一、目标页面解析页面内容整个过程结果展示一、目标页面首先确定好目标用户,这里选择知名演员李现的微博账号。爬取数据不用于非法或者违规的用途,单纯用于学习研究。打开李现的微博主页,在链接中可以看到他的账号id是2360812967,这个是用来识别每个微博账号的id。这是打开网页的源代码,会发现里面没有我们直接看到的如图中的内容,因为页面是通过Ajax动态渲染得到的,所以直接的网页源代

2020-09-10 15:25:20 2090

原创 python3-情感分析--------百度智能云AI接口

from aip import AipNlpimport pandas as pdimport timeimport re""" 你的 APPID AK SK """ #需要自己取智能云百度平台申请账号APP_ID = 'XXX'API_KEY = 'XXXXX'SECRET_KEY = 'XXXXXXXXX'client = AipNlp(APP_ID, API_KEY, SECRET_KEY)path = 'XXX.csv' #需要处理的文件的路径df = pd.r

2020-08-23 22:46:41 1628 2

原创 python3-爬虫---猫眼电影榜单爬虫实战

猫眼电影榜单爬虫实战文章目录猫眼电影榜单爬虫实战一、观察目标网页特征二、爬虫程序三、结果展示四、总结一、观察目标网页特征1.1. 观察下猫眼电影网站及其代码。传送门:猫眼网站首页1.2. 选择【榜单】页面,可以看到有五个榜,分别是【热映口碑】,【最受期待】,【国内票房】,【北美票房】和【TOP 100】,基本上根据自己的需求来选择哪个榜单,每个榜单信息的主要差异在于显示的是评分,想看人数还是票房。【这里选择TOP 100 榜进行实战分析,对应的网页链接记得自己查看当前的URL】猫眼电影-榜单-T

2020-08-22 17:33:46 1144

原创 python3---情感分析(基于词典中文)

写在前面:现有的情感分析比较常用的有两种,分别是基于词典的和机器学习,前者也属于非监督学习,后者自然一般属于监督学习。刚开始学情感分析,下面先从**【基于词典的情感分析】**开始进行:词典:我东搜西找找到了一些感觉是常用的字典,主要有(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,BosonNLP_sentiment_score,知网hownet2007)词典下载传送门因为刚学,所以设计了一些比较基础的规则(基于文本预处理之后生成了关于每一个文档的【词列表向量】)

2020-07-08 21:19:27 3778 66

原创 python3---numpy基本内容,小白上路

python3numpy基本内容列表转数组numpy压缩成稀疏矩阵矩阵代码实现列表转数组:输出样式如下:Alt]numpy压缩成稀疏矩阵:

2020-07-05 09:24:47 139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除