函数的调用
学无止境还得学
技术更新很快,只有自己不断学习,不断进步,才能与时俱进。
展开
-
2020-08-10
python文本相似度计算1.分词、去停用词2.词袋模型向量化文本3.TF-IDF模型向量化文本4.LSI模型向量化文本5.计算相似度**词袋模型最简单的表示方法是词袋模型。把一篇文本想象成一个个词构成的,所有词放入一个袋子里,没有先后顺序、没有语义。例如:John likes to watch movies. Mary likes too.John also likes to watch football games.这两个句子,可以构建出一个词典,key为上文出现过的词,value原创 2020-08-10 16:19:14 · 200 阅读 · 0 评论 -
python中正则表达式与jieba分词的使用
这次和大家分享一下主要使用正则表达式匹配文本信息内容的案例,其中还用到了jieba分词词性标注技术,和一些对文本的切片工作。有兴趣学习的可以详细看看,具体内容,应该有点帮助,这是本人一个一个代码敲出来的1000多行代码。# coding:utf-8import osimport docximport pickleimport timeimport datetimeimport reimport sysimport jieba.posseg as psgimport numpy as np原创 2021-01-07 16:04:03 · 900 阅读 · 2 评论 -
爬虫之 静态页面和动态页面
***## 标题*爬虫有静态页面和动态页面,这里先讲解静态的选取,先看网页的源代码里面是否有需要爬取的关键词,有就是静态页面直接调用cookile get得到数据 **关于python的爬虫的一些内容与爬安居客与58同城的租房信息,选取一些关键词,进行爬取,代码如下:import requests,pymysqlfrom lxml import etreeimport time#爬取内容一下七个信息#标题 户型 面积 区域 小区 交通 价格#龥 0 replace('龥,驋,餼,鸺,麣,龤,原创 2020-08-06 15:17:35 · 971 阅读 · 1 评论 -
python函数的一些调用
python中调用相同目录下的文件里面的函数 为什么会说函数不存在和不能调用呢 路径 文件名都正确 而且其他函数可以调用 就几个函数不能调用加粗样式在这里插入代码片from module.reg_utils import reg_text , Text, my_split, my_findall, my_sub, get_element_from_concatpython的一些模型调用问题标题欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想原创 2020-07-28 16:31:20 · 124 阅读 · 0 评论