![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python进阶
MengDiLI
python初级码农
展开
-
python 爬取doc文档
doc_href='https://resource.lzbank.com:18106/cportalFileServer/files//site/doc/pc/20201/12021/goods/20200521172408609syj8FsHJ.doc'conten=requests.get(doc_href).content with open('D:\爬取doc\doc\\1.doc','wb')as f: f.write(conten)另外,python没法直接处理doc原创 2020-05-26 14:42:06 · 1770 阅读 · 0 评论 -
python代码中写sql语句的模糊查询
db = pymysql.connect(host="127.0.0.1", user="root", password="", db="demo", port=3306,charset='utf8')cur = db.cursor(cursor=pymysql.cursors.DictCursor)cur.execute('select * from demo_table where cp_name like "%%%s%%" and yh_name="云南红塔银行"' % cp_name)res原创 2020-05-22 11:04:30 · 1617 阅读 · 0 评论 -
python使用replace做多字符替换
如果需要替换的字符比较少,我们可以直接写出来,但是多的话,就要用for循环了原创 2020-01-03 15:59:29 · 8468 阅读 · 4 评论 -
python的全文检索库Whoosh使用示例
pip install whoosh首先,我有一个xiaoshuo文件夹,装了几部小说直接上代码:首先是创建索引的文件from whoosh.filedb.filestore import FileStoragefrom whoosh.fields import *from jieba.analyse import ChineseAnalyzerimport osanaly...原创 2019-12-14 15:54:00 · 2031 阅读 · 1 评论 -
自制文本分类
这几天公司需求,要做文本分类,看了些文章,各种机器学习、神经网络,看不懂。自己结合结巴分词做了个简单的文本分类实现功能,总体来说还可以。运行结果:自己写的,咋方便咋来,反正各种半自动,没怎么注重过程,小伙伴看了之后可以自己改一下,让它更便捷。首先要有数据,我是爬的各种新闻网站,得到的各类数据。有了数据之后,就可以写这次的代码了首先是训练数据,通俗来说就是把文章处理成想要的格式。第...原创 2019-10-26 18:44:34 · 446 阅读 · 0 评论 -
fasttext文本分类
前几天为了实现文本分类,看了不少博客文章之类的,就fasttext还算稍微能看懂,代码也最终能跑得起来,但是好多博客的代码都是更新之前的了,会报错,找坑填坑一路爬出来,总算跑通了,发出来做个记录吧。看过我博客的小伙伴应该知道我的这篇自制文本分类的骚操作还是跟它一样,先有数据,我就不多说了。接下来首先是先写一个文本分类处理的代码,待会儿再写一个文本分类预测的代码,我是分开运行的,你也可以自己整...原创 2019-10-27 10:42:55 · 739 阅读 · 3 评论