- 博客(4)
- 收藏
- 关注
原创 python去除文本中的网址
import restring1 = '我大航海时代获得很好的或多或少的基督教https://weibo.com/1699432410/GC59cqsyF们'string2 = '我http://qiye.tianya.cn//blog/infoReader3.aspxblogID=1776&ComID=12&infoType=1们'results = re.compi...
2020-04-29 18:30:05 4140
原创 数据挖掘之特征工程
1.什么是特征工程: 是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数 据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更 高效的特征以刻画求解的问题与预测模型之间的关系。特征工程有很多的方法,其中比较常见的有: 1.1特征归一化 ...
2020-03-24 21:35:14 283
原创 python 调用ElasterSearch来完成全文检索实战
一.数据源:es的数据源可以是数据库,文档, json文件,以及爬虫爬取的二.前提准备: 1.安装es,详细请参考 es安装教程 2.安装kibana,详细请参考 kibana安装教程 3.安装ik分词库,详细请参考https://blog.csdn.net/we...
2020-02-26 16:47:43 608
原创 查找python中某个元素出现在list的所有下标
利用字典存储,list里面出现很多次的元素,并记录它们的下标。def search_index(list1):accept_list = []sample = set(list1)for i in sample:if list1.count(i) >= 2:accept_list.append(i)dict1 = {}for i in accept_list:index1 ...
2019-08-25 11:38:06 1237
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人