![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 58
神创
这个作者很懒,什么都没留下…
展开
-
mac pycharm 下安装numpy
python3 -m pip install numpy -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com原创 2021-05-25 00:10:33 · 1089 阅读 · 0 评论 -
【python】数组内某数加一如何实现?
参考:https://zhuanlan.zhihu.com/p/50332730数组修改其实数组修改,就是重新赋值,和清除一个变量的值重新赋值一样,如:arr = ['1','2','3']arr[0] = '312'print(arr) 打印出来的结果为:['312','2','3']对于没有基础的菜鸟来说,这个问题既简单又愚钝= =>>> import numpy as np>>> arr = [(1,0),(2,0)]>.原创 2021-05-04 14:21:21 · 2136 阅读 · 0 评论 -
【python】如何提取多维数组内的单个数字?
>>> a = [(1,0),(2,0)]>>> print(a)[(1, 0), (2, 0)]>>> print(a[1][0])2原创 2021-05-04 13:33:33 · 1571 阅读 · 0 评论 -
【探索】python如何实现搜索引擎?whoosh (未完成)
问题:这个python搜索引擎针对什么资源?|如果对txt文件实现搜索,展示在cmd命令行上吗?-----------------------------------------------------------------假想:一个简陋的pyqt的搜索页面,后端的数据是《西方哲学史》这本书-----------------------------------------------------...原创 2018-03-20 14:26:35 · 932 阅读 · 1 评论 -
【python】判断数据 属性 类型
>>> print(type(output))<class 'str'>>>> print(type(line))<class 'list'>>>> f = {}>>> print(type(f))<class 'dict'>>>&原创 2018-04-16 09:21:56 · 2008 阅读 · 0 评论 -
【问题】python 的print 运行结果 怎么赋值给变量 或者保持成什么类型属性?才能进一步编辑,不使用textio
深拷贝-------------------------------------------------------------------------------------------原创 2018-04-16 10:37:19 · 7172 阅读 · 0 评论 -
[python jieba]词性标注 2018年4月16日10:40:07
>>> import jieba>>> import jieba.posseg>>> string = '陈晨和林迪是好朋友'>>> seg = jieba.posseg.cut(string)>>> print(seg)<generator object cut at 0x000001原创 2018-04-16 10:40:19 · 339 阅读 · 0 评论 -
【python镜像分词】运用到文章
>>> import re>>> t = open('E:/序言.txt','r')>>> text = t.read()>>> import jieba>>> b = ','or '。'>>> textCut = text.split(b)>&原创 2018-04-16 11:30:49 · 201 阅读 · 0 评论 -
【依存树】短语结构树转化依存树
参考:https://www.jianshu.com/p/073f162cbb28--------------------------------------------------------应用的领域:短语缩句、提取文本主要内容、文本分类、情感分析、意见抽取-----------------------------------------------发展:短语分词——词性标注——短语句法树——...原创 2018-04-16 15:33:02 · 3595 阅读 · 1 评论 -
【python】词性标注结合镜像分词
>>> import jieba>>> import jieba.posseg as pseg>>> f = open('E:/序言.txt','r')>>> f.read()'美国版序言\n\n-----------------------------------\n\n\u3000\u3000目前已经有不少部哲学史了,我的...原创 2018-04-16 16:56:40 · 302 阅读 · 0 评论 -
【python】jieba词性标注 并列join
----------------------------------------------------------------的-就-要求-我们-对于-一般-历史-的-叙述-,-比-通常-哲学史-家所-做-的-为-多- 。-我-还-发觉-这-一点-对于-一般-读者-未必-是-很-熟悉-的-那-几段-时期-,-尤其-必要-。-经院哲学-的-大-时代-乃是-十一-世纪-改革-的-产物-,-而-这些-...原创 2018-04-17 00:08:25 · 2553 阅读 · 0 评论 -
[python]灵感-镜像
原创 2018-04-15 20:48:27 · 199 阅读 · 0 评论 -
【python】jieba分词的搜索模式,之后要怎么用? 关键词是 聚类分析
参考:https://blog.csdn.net/songzhilian22/article/details/49636725GitHub:https://github.com/likeyiyy/chinese_text_cluster---------------------------------------------------------------------参考:https://ww...原创 2018-04-15 20:38:11 · 1337 阅读 · 0 评论 -
【python】正则表达式处理文章,结构化和提炼大意方法1
>>> import re>>> end = re.compile(r'[u4e00-\u9fa5].$')>>> start = re.compile(r'[u4e00-\u9fa5].')>>> with open('E:/切图.txt','r')as f:... for line in f:... ...原创 2018-04-15 19:58:47 · 249 阅读 · 0 评论 -
【python 搜索引擎】最简单,对本地文本进行 pylucene未完成()
需要实现:只要搜索文章txt中的句子就好了。------------------------------参考:百度搜索-python 最简搜索引擎网页:http://blog.csdn.net/qq_31113079/article/details/55226264 利用Python搭建的简易排序搜索引擎 上文对我无用 = =英文网站:http://www.zackgrossbart.com...原创 2018-03-20 15:04:57 · 1128 阅读 · 0 评论 -
【python爬虫】尝试爬取-获取网站的编码信息(未完)
参考:http://blog.csdn.net/ajinglingmofashi/article/details/53611168>>> import urllib.request>>> shenda = urllib.request.urlopen(url)>>> shenda = "http://zsb.szu.edu.cn/">&g..原创 2018-03-21 21:49:46 · 551 阅读 · 0 评论 -
python爬虫【记录】BeautifulSoup 的用法遍历学习
前面都是顺理成章了 = =,这个网站好像不能爬取,半天没有反馈------------------换个网站:----------------------------------------------编码不对-----------------------------------------------------------------下面买有加()所以错了下面就正确了:-------------...原创 2018-03-21 23:55:53 · 739 阅读 · 0 评论 -
python爬虫【实例】爬取豆瓣电影评分链接并图示()-问题如何爬取电影图片(解决有代码)
这里只有尾巴,来分析一下确定范围:如何爬取图片并下载?参考:http://blog.csdn.net/chaoren666/article/details/53488083--------------------------------------------------------------放弃这个方法毕竟我用的都是python3--------------------------------...原创 2018-03-22 09:35:25 · 6479 阅读 · 0 评论 -
【python】根据图片链接(地址)抓取图片
参考:https://bbs.csdn.net/topics/391929530成功了import urlliburllib.urlretrieve('图片链接http://', 'f:/自己的本地地址.jpg')原创 2018-03-22 11:23:47 · 5960 阅读 · 0 评论 -
【python爬虫】翻页爬取{探索}(未完成)
参考:https://www.cnblogs.com/yuexizhuo/p/3946178.html说明:利用urllib2中的post------------------------------------------------问题:什么是post键值?就是要去网页上面找page的页面标记规律。-----------------------------------------------pa...原创 2018-03-26 21:43:53 · 2043 阅读 · 0 评论 -
【python】正则表达式,提取句子开头两个字
参考:https://www.zhihu.com/question/57105320/answer/151627547代码:>>> import re>>> word = "肉搭配辣椒吃起来很棒棒">>> p = re.complile(r"[\u4e00-\u9fa5]..")Traceback (most recent call la原创 2018-04-15 16:12:35 · 3481 阅读 · 0 评论 -
【python】提取文章句子中的,开头与结尾的两个中文字符。
参考:【python】正则表达式,提取句子开头两个字 正则表达式在线生成工具--------------------------------------------------------------------------->>> end = re.compile(r'[\u4e00-\u9fa5].$')>>> start = re.compile(...原创 2018-04-15 17:03:55 · 3445 阅读 · 0 评论 -
python【】read()\readline()\readlines()
参考:https://www.cnblogs.com/qi09/archive/2012/02/10/2344964.html------------------------------------------------->>> f = open('E:/序言.txt','r')>>> for line in f.readlines():... pr...原创 2018-04-17 09:15:49 · 217 阅读 · 0 评论 -
python 列表交叉合并
参考:https://www.zhihu.com/question/46872925import intertools>>> list(itertools.chain.from_iterable(zip(l,m)))['美国版', 'nz', '序言', 'n', '\n', 'x', '\n', 'x', '-', 'x', '-', 'x', '-', 'x', '-', ...原创 2018-04-17 13:14:16 · 6041 阅读 · 1 评论 -
【python分词】镜像分词
>>> import re>>> text = "目前已经有不少部哲学史了">>> from bs4 import BeautifulSoup>>> import jieba>>> seg = jieba.cut(text.strip(),cut_all = False)原创 2018-04-15 21:57:41 · 440 阅读 · 0 评论 -
python(分割txt为多个txt)
参考:https://www.zhihu.com/question/58487345根据上面的改动为:效果:代码:>>> with open('E:/44.txt','r')as f:... lines = f.readlines()... for index,line in enumerate(lines,1):... print(index,line)...原创 2018-04-05 13:59:22 · 18138 阅读 · 4 评论 -
python爬虫 如何获得完整链接(动态网页)
参考:https://blog.csdn.net/hdu09075340/article/details/74202339-------------------参考:https://www.cnblogs.com/hhh5460/p/5044038.html四中方法'''得到当前页面所有连接'''import requestsimport refrom bs4 import Beau...原创 2018-04-05 17:29:28 · 12170 阅读 · 0 评论 -
【实例】python 处理列表 取前六个值
参考:https://zhidao.baidu.com/question/242989096744106444.html--------------------------------------------------------------原创 2018-04-05 18:10:59 · 13466 阅读 · 0 评论 -
如何使用python Xpath 爬需要的信息? 未解决
参考:https://www.cnblogs.com/gaochsh/p/6757475.html挺困难的原创 2018-04-05 18:35:57 · 169 阅读 · 0 评论 -
记录【python爬虫】Xpath 打印处理的不同值类型,处理Element a at 0x
>>> import re,urllib.request>>> from bs4 import BeautifulSoup>>> from lxml import etree>>>--------------------------------------------------------------------------...原创 2018-04-05 19:19:01 · 5757 阅读 · 0 评论 -
【实例】python抓取网页,使用Xpath/lxml;BeautifulSoup/Bs4;urllib.request;re;最后导入excel
前面主要是解析html,提炼出所需的部分>>> import re,urllib.request>>> from bs4 import BeautifulSoup>>> from lxml import etree>>> url = "http://zsb.szu.edu.cn/zanouse_1">原创 2018-04-06 19:18:43 · 462 阅读 · 0 评论 -
【python jieba】词频统计并标出数量
参考:https://blog.csdn.net/u014070086/article/details/73201590----------------------------------------------------------------------------------------------------------------------代码:import jiebatext =...原创 2018-04-07 11:56:19 · 20818 阅读 · 1 评论 -
【精华】【实例】运用hanlp 通过 python 结合jpype 导出依存句法可视化
-------------------------------------------------------效果图 ------------------------------------------------------->>> from jpype import *>>>... startJVM(getDefaultJVMPath(), "-Djava....原创 2018-03-01 21:40:06 · 2435 阅读 · 1 评论 -
【实例】词频统计及其可视化python+jieba+wordcloud
文本提供最后案例的文档下载:https://download.csdn.net/download/qq_19741181/10278764python 根据文本生成标签云 -----------------------------------------------------------------------------------------------效果>>> impo...原创 2018-03-10 10:26:31 · 7840 阅读 · 0 评论 -
[python 主谓宾否]正则表达式+jieba分词
>>> import re>>> match = r'[\u4e00-\u9fa5]+\sn'>>> f = open('E:/序言++.txt').read()>>> z = re.findall(match,f)>>> print(z)['美国版 n', '序言 n', '部 n', '原创 2018-04-17 15:53:17 · 4130 阅读 · 1 评论 -
【python爬虫】抓取链接网页内的文本 (第一步 定位超链接文本)
第一步:导入模块>>> import re >>> from bs4 import BeautifulSoup >>> import urllib.request -------------------------------------第二步:导入网址url = "http://zsb.szu.edu.cn/zbs.html" ----...原创 2018-04-04 23:15:00 · 20304 阅读 · 0 评论 -
pythonjieba 分词 结束后用txt打开()
>>> with open('E:/99999.txt','r')as f:... for line in f:... seg = jieba.cut(line.strip(),cut_all = False)... output = '/'.join(seg)... with open('E:/13212.txt','a+')as s:... ...原创 2018-04-05 00:17:25 · 1270 阅读 · 0 评论 -
python【jieba】如何换行 (分词同时)
参考:https://blog.csdn.net/sinat_35376396/article/details/52415328------------------------------------------------------------------代码实现:>>> with open('E:/99999.txt','r')as f:... for line in...原创 2018-04-05 09:08:45 · 3131 阅读 · 0 评论 -
【python】正则表达式,处理文章,获得首尾大意
参考:https://blog.csdn.net/u011089523/article/details/61914968 分句参考:https://zhidao.baidu.com/question/401008771.html 标点分句>>> f.close()>>> f = open('E:/序言.txt','r')>>> line =...原创 2018-04-15 20:15:40 · 313 阅读 · 0 评论 -
【python jieba excel】用结巴分词,将文章分句,一行一行分词,并导入excel
第一步:将文章以句号形式分开,并标号第二步:使用结巴遍历每一句,并分词第三步:使用txt导入excel------------------------------------------------------------------参考自己的文章:第一篇:python(给每行开头添加序号)&(每行末尾添加序号)第二篇:python【jieba】如何换行 (分词同时)| pythonjie...原创 2018-04-06 21:43:37 · 13066 阅读 · 4 评论