txt
文章平均质量分 60
神创
这个作者很懒,什么都没留下…
展开
-
【实例】python 对文字 进行 替换 空格 为回车换行! 结果导出txt
说明:python 对文字 进行 替换 空格 为回车换行----------------------------------------------参考:python中如何把一个字符串中某一个字段替换成回车符 | https://zhidao.baidu.com/question/243712254241900884.html 如何用python把一个txt文件中所有逗号——,替换成空格? |...原创 2018-02-08 21:27:20 · 16732 阅读 · 1 评论 -
【python】提取文章句子中的,开头与结尾的两个中文字符。
参考:【python】正则表达式,提取句子开头两个字 正则表达式在线生成工具--------------------------------------------------------------------------->>> end = re.compile(r'[\u4e00-\u9fa5].$')>>> start = re.compile(...原创 2018-04-15 17:03:55 · 3475 阅读 · 0 评论 -
【python】正则表达式处理文章,结构化和提炼大意方法1
>>> import re>>> end = re.compile(r'[u4e00-\u9fa5].$')>>> start = re.compile(r'[u4e00-\u9fa5].')>>> with open('E:/切图.txt','r')as f:... for line in f:... ...原创 2018-04-15 19:58:47 · 262 阅读 · 0 评论 -
[python]灵感-镜像
原创 2018-04-15 20:48:27 · 207 阅读 · 0 评论 -
[python jieba]词性标注 2018年4月16日10:40:07
>>> import jieba>>> import jieba.posseg>>> string = '陈晨和林迪是好朋友'>>> seg = jieba.posseg.cut(string)>>> print(seg)<generator object cut at 0x000001原创 2018-04-16 10:40:19 · 343 阅读 · 0 评论 -
【python镜像分词】运用到文章
>>> import re>>> t = open('E:/序言.txt','r')>>> text = t.read()>>> import jieba>>> b = ','or '。'>>> textCut = text.split(b)>&原创 2018-04-16 11:30:49 · 209 阅读 · 0 评论 -
【python】词性标注结合镜像分词
>>> import jieba>>> import jieba.posseg as pseg>>> f = open('E:/序言.txt','r')>>> f.read()'美国版序言\n\n-----------------------------------\n\n\u3000\u3000目前已经有不少部哲学史了,我的...原创 2018-04-16 16:56:40 · 312 阅读 · 0 评论 -
python【】read()\readline()\readlines()
参考:https://www.cnblogs.com/qi09/archive/2012/02/10/2344964.html------------------------------------------------->>> f = open('E:/序言.txt','r')>>> for line in f.readlines():... pr...原创 2018-04-17 09:15:49 · 228 阅读 · 0 评论 -
pythonjieba 分词 结束后用txt打开()
>>> with open('E:/99999.txt','r')as f:... for line in f:... seg = jieba.cut(line.strip(),cut_all = False)... output = '/'.join(seg)... with open('E:/13212.txt','a+')as s:... ...原创 2018-04-05 00:17:25 · 1293 阅读 · 0 评论 -
python【jieba】如何换行 (分词同时)
参考:https://blog.csdn.net/sinat_35376396/article/details/52415328------------------------------------------------------------------代码实现:>>> with open('E:/99999.txt','r')as f:... for line in...原创 2018-04-05 09:08:45 · 3183 阅读 · 0 评论 -
【python分词】镜像分词
>>> import re>>> text = "目前已经有不少部哲学史了">>> from bs4 import BeautifulSoup>>> import jieba>>> seg = jieba.cut(text.strip(),cut_all = False)原创 2018-04-15 21:57:41 · 446 阅读 · 0 评论 -
【python】正则表达式,处理文章,获得首尾大意
参考:https://blog.csdn.net/u011089523/article/details/61914968 分句参考:https://zhidao.baidu.com/question/401008771.html 标点分句>>> f.close()>>> f = open('E:/序言.txt','r')>>> line =...原创 2018-04-15 20:15:40 · 318 阅读 · 0 评论 -
【python jieba excel】用结巴分词,将文章分句,一行一行分词,并导入excel
第一步:将文章以句号形式分开,并标号第二步:使用结巴遍历每一句,并分词第三步:使用txt导入excel------------------------------------------------------------------参考自己的文章:第一篇:python(给每行开头添加序号)&(每行末尾添加序号)第二篇:python【jieba】如何换行 (分词同时)| pythonjie...原创 2018-04-06 21:43:37 · 13146 阅读 · 4 评论 -
python(给每行开头添加序号)&(每行末尾添加序号)
参考:https://zhidao.baidu.com/question/328141527634315845.html(无用)最终实现了:代码:>>> file = open("E:/132125.txt",'r')>>> lines = file.readlines()>>> print(lines)>>> w原创 2018-04-05 10:52:24 · 20348 阅读 · 1 评论 -
【学习python】re 正则表达式匹配特定词性的conll,提取句子主干(主谓宾)
------------------找寻特定内容------------------------------->>> # -*- coding: utf-8 -*->>> import re>>> pattern = re.compile(u'[白蓝绿黄][A-Z][A-Z0-9]{5}')>>> match = patter...原创 2018-03-11 12:52:11 · 4021 阅读 · 0 评论 -
【实例】词频统计及其可视化python+jieba+wordcloud
文本提供最后案例的文档下载:https://download.csdn.net/download/qq_19741181/10278764python 根据文本生成标签云 -----------------------------------------------------------------------------------------------效果>>> impo...原创 2018-03-10 10:26:31 · 7853 阅读 · 0 评论 -
【精华】【实例】运用hanlp 通过 python 结合jpype 导出依存句法可视化
-------------------------------------------------------效果图 ------------------------------------------------------->>> from jpype import *>>>... startJVM(getDefaultJVMPath(), "-Djava....原创 2018-03-01 21:40:06 · 2482 阅读 · 1 评论 -
python(分割txt为多个txt)
参考:https://www.zhihu.com/question/58487345根据上面的改动为:效果:代码:>>> with open('E:/44.txt','r')as f:... lines = f.readlines()... for index,line in enumerate(lines,1):... print(index,line)...原创 2018-04-05 13:59:22 · 18187 阅读 · 4 评论 -
【实例】CMD 创建文件夹,并包括子文件夹和txt并写入内容 ,以及删除文件c参考:
参考:https://jingyan.baidu.com/article/49ad8bceb0237f5834d8fa19.html--------------------------------------------------------------------------------------------------------------------------------------...原创 2018-04-01 01:30:48 · 1167 阅读 · 0 评论 -
【定位】python 定位文章开头,句首
参考:https://zhidao.baidu.com/question/527646540.htmlfp = open('meelo.txt')data = fp.read() #读取完文件内容后,指针指向文件结尾fp.seek(0) #指针回到文件开头原创 2018-03-04 21:36:25 · 506 阅读 · 0 评论 -
【实例】python 将jieba分词 展示在html
--------------------------------------------------------参考:http://blog.csdn.net/reallocing1/article/details/51694967--------------------------------------------------------配置:windows +python 3.6.3 + j...原创 2018-02-08 16:13:35 · 618 阅读 · 0 评论 -
【实例】python bs4 beautifulsoup + urllib.request 提取网址
>>> import re>>> from bs4 import BeautifulSoup>>> import urllib.request>>> import lxml>>> import requests>>> url = 'http://www1.sz原创 2018-03-08 16:26:58 · 2541 阅读 · 0 评论 -
【记录】python中,两种读取txt的方式;并结合jieba找出词频位置分布
>>> f = open('E:/西方哲学史.txt','r')>>> print(f)<_io.TextIOWrapper name='E:/西方哲学史.txt' mode='r' encoding='cp936'>>>> f = open('E:/西方哲学史.txt').read()>>> print(f)西方原创 2018-03-01 23:22:41 · 1092 阅读 · 0 评论 -
【实例】python中文词频排序 + html提取文本工具下载链接
>>> with open("E:/cipin.txt") as wf,open("E:/asd.txt",'w') as wf2:... for word in wf:... word_lst.append(word.split(','))... for item in word_lst:... for item2 in item:... ...原创 2018-03-10 13:58:14 · 591 阅读 · 0 评论 -
【尝试】 初次使用scrapy+python (建立项目)
-------------用cmd建立目录-------------------------C:\Users\d>E:E:\>scrapy startproject movieNew Scrapy project 'movie', using template directory 'c:\\users\\d\\appdata\\local\\programs\\python\\pyth...原创 2018-03-10 14:24:18 · 291 阅读 · 0 评论 -
【尝试】scrapy继创建工程后创建爬虫程序
E:\movie>scrapy genspider meiju meijutt.comCreated spider 'meiju' using template 'basic' in module: movie.spiders.meiju----------------------------------scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置...原创 2018-03-10 14:40:48 · 411 阅读 · 0 评论 -
【统计词频】python+excel +jieba
https://www.cnblogs.com/WeyneChen/p/6675355.html 参考:python简单词频统计——简单统计一个小说中哪些个汉字出现的频率最高参考:https://www.cnblogs.com/jiayongji/p/7119065.html | 好玩的分词——python jieba分词模块的基本用法-------------------------------...原创 2018-03-10 15:19:59 · 7131 阅读 · 1 评论 -
【实例】通过jieba 提取 关键词 (python)
>>> import jieba>>> import os>>> f = open("E:/西方哲学史.txt",'r')>>> f = f.read()>>> seg_list = jieba.cut(f)>>> print("原创 2018-02-23 23:43:40 · 3864 阅读 · 0 评论 -
【实例】python中jieba 添加 自定义词语?
参考:http://blog.sina.com.cn/s/blog_7d8326290102vzpb.html分词词典:jieba.load_userdict(file_name) # file _name 为路径【例如:jieba.load_userdict("C:\\Users\\Luo Chen\\Desktop\\lixiaofu.txt")seg_list = jieba.cut("李小...原创 2018-02-24 00:06:34 · 19379 阅读 · 4 评论 -
【实例】用python选择 含有 特定词 的句子
参考:百度知道:https://zhidao.baidu.com/question/942099150621602452.htmlPython 3.6.3 (v3.6.3:2c5fed8, Oct 3 2017, 18:11:49) [MSC v.1900 64 bit (AMD64)] on win32Type "help", "copyright", "credits" or "licen...原创 2018-02-15 13:48:23 · 9512 阅读 · 0 评论 -
【实例】Python 用jieba分词 导出txt(干货)
--------------------------------------------------------------------------------------完全的菜鸟,琢磨了好久 = =,终于两天时间成功捣鼓出来了, 参考了很多页面,翻来倒去所有的试过都没成功 = =----------------------------------我是分割线-------------------...原创 2018-02-08 11:47:58 · 12368 阅读 · 5 评论 -
【实例】python re 正则表达式 同时选择带有“是”和“的”句子
impor = re>>> name = '是'and'的'>>> text = open('E:/西方哲学史.txt','r').read()>>> results = re.findall(r'[^。]*?{}[^。]*?。'.format(name), text)>>> for i, r in enumerate(res...原创 2018-02-24 12:08:34 · 1388 阅读 · 0 评论 -
【实例】python re 选择含特定词的句子 导出txt?
>>> name = '是'and'的'>>> text = open('E:/西方哲学史.txt','r').read()>>> results = re.findall(r'[^。]*?{}[^。]*?。'.format(name), text)>>> for i, r in enumerate(results, 1):....原创 2018-02-24 16:37:40 · 2289 阅读 · 0 评论 -
【实例】python 抓取网页标题?
pip install readability-lxml>>> import requests>>> from readability import Document>>> respose = requests.get('https://segmentfault.com/a/1190000005768094')>>> doc ...原创 2018-02-24 17:06:22 · 6380 阅读 · 3 评论 -
【re】去除中文以外的字符,主谓宾重组
参考:http://tieba.baidu.com/p/1988648224----------------------------------------------------# -*- coding: utf-8 -*-import res = u"中文bab#$%$#%#$"r = re.sub("[A-Za-z0-9\[\`\~\!\@\#\$\^\&\*\(\)\=\|\{\}...原创 2018-03-11 13:25:48 · 769 阅读 · 0 评论 -
【实例】将python抓取的网页 导出 txt中
参考:【实例】python 使用beautifulSoup 抓取网页正文>>> import requests>>> import re>>> from bs4 import BeautifulSoup>>> r=requests.get("https://s.taobao.com/search?q=iphone")&am原创 2018-02-24 22:49:15 · 1449 阅读 · 0 评论 -
【实例】python jieba词性标注 并导出txt
>>> import jieba.posseg as pseg>>> f = open('E:/西方哲学史.txt','r') f = f.read()>>> words = pseg.cut(f)>>> for w in words:... print (w.word,w.flag)...Building pre...原创 2018-02-24 15:15:02 · 2895 阅读 · 0 评论 -
【python jieba】词频统计并标出数量
参考:https://blog.csdn.net/u014070086/article/details/73201590----------------------------------------------------------------------------------------------------------------------代码:import jiebatext =...原创 2018-04-07 11:56:19 · 20837 阅读 · 1 评论