- 博客(17)
- 收藏
- 关注
原创 python利用nltk工具,数文件夹中所有文本文件的频率最高的单词
Life is tooooo short , you need python. 这两天看了下nltk(Natural Language Processing Toolkit)工具包,在感受着其强大功能的时。An idea comming ,既然这是一个工具,那能不能真正的用起来了。那么前段时间看到晚上一些关于统计字符的样题,不是可以完美匹配嘛。下面是一个小样例:from nltk impor...
2018-07-04 19:29:50 842 1
原创 一年项目思考-流水账记录并思考(1)
一年项目思考-流水账记录并思考值此佳节......近一年,在做一个用户经营项目的项需求分析(BA岗位)。我在这忙忙碌碌、浑浑噩噩的一年里,无论从心理还是业务上都或多或少的做过过山车。时间飞逝,一年了,不给自己来个总结,真是有点对不起这荒废的日子。本想高谈阔轮,奈何读书太少,文章写不了,这里还是先乱记录先,不烦我们也来个W思考:第一层:What is 用户(user、customer、consumer)What is 经营(operator)Why 用户经营第二层:Who
2020-10-24 22:12:29 258
原创 工作笔记-常用名词
RFM模型:在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。传统的RFM模型与电信业RFM模型的各指标含义比较模型 R(近度) F(频度) ...
2020-02-24 20:06:07 289
原创 PyCharm+Qt环境搭建记录
1.安装Pycharm2.安装Qt 5.123.PyCharm中配置external toolsQt Designer配置:/Users/thunder/Qt5.12.2/5.12.2/clang_64/bin/Designer.appPyUIC配置:/Library/Frameworks/Python.framework/Versions/3.6/bin/pyuic5...
2019-04-10 15:28:37 484
原创 python join简单说明和小样例
join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个 新的字符串下面几个样例来看看具体用法'''给你一字典a,如a={1:1,2:2,3:3},输出字典a的key,以','连接,如‘1,2,3'。要求key按照字典序升序排列(注意key可能是字符串)。例如:a={1:1,2:2,3:3}, 则输出:1,2,3'''#处理...
2018-07-31 15:49:20 309
原创 jieba 分词 入门小笔记
import jiebajuzi1 = "你妈妈喊你回家吃饭啦!你在干嘛,怎么还不回家?"#jieba.add_word("还不")jieba.add_word("还不")seg_list = jieba.cut(juzi1,cut_all = False)text = " ".join(seg_list)print(text)不加自定义词你 妈妈 喊 你 回家 吃饭 啦 ! 你 在 干嘛 ...
2018-07-04 20:57:58 315
原创 python 连接mysql数据库
#官网样例CREATE TABLE `users` ( `id` int(11) NOT NULL AUTO_INCREMENT, `email` varchar(255) COLLATE utf8_bin NOT NULL, `password` varchar(255) COLLATE utf8_bin NOT NULL, PRIMARY KEY (`id`)...
2018-06-27 18:29:25 176
原创 列表连续初始化的错误
# -*- coding: utf-8 -*-""" 抽取某本书的前 50 条短评内容并计算评分的平均值"""import requestsfrom bs4 import BeautifulSoupimport resum = 0url = 'https://book.douban.com/subject/26853356/comment
2018-05-22 11:20:10 284
原创 python3.6爬取豆瓣读书《鱼王》前50条短评内容和平均分数
这里先获取平均分 //待续打开网页 https://book.douban.com/subject/26853356/comments/ 综合下一页可以知道: 后面的页码 https://book.douban.com/subject/26853356/comments/hot?p=2<ul class="comment-paginator">
2018-05-21 23:31:00 2056
转载 CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法test图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I ...
2018-05-21 18:56:27 382
原创 python爬虫学习随记
通过豆瓣网页源代码,了解python爬虫的一些基础知识;mocc网的一个例子么有html经验的我,真是困难啊,这里边做边学html基础知识http://www.runoob.com/tags/html-reference.html主要有2个库:requests: http://www.python-requests.org/en/master/bs4: https://www.crummy.com...
2018-05-21 16:26:15 368
原创 统计字符串中的字符个数
def countchar(str): '''chr(65) = 'A' chr(97) = 'a' ord('a') = 65 大小写字母ASCII判断''' list_input = list(str) word_list = [0] * 26 #这里若不这样初始化,后面列表改值的时候,会出现越界错误 for i in range(6...
2018-05-19 19:23:59 1911
原创 寻找第n个默尼森数。涉及质数判断和循环break continue
'''寻找第n个默尼森数。代码格式如下:def prime(num): ...def monisen(no): … … return xxxprint(monisen(int(input()))) #此处不需要自己输入,只要写这样一条语句即可,主要完成monisen()函数寻 (4分)经典程序设计问题:找第n个默尼森数。P是素数且M也是素数,并且满足等式...
2018-05-17 19:28:06 398
原创 read readline readlines 简要分析
with open("/Users/thunder/Desktop/src/info.txt", "r") as f: txt_read = f.read() print(txt_read,"###########################") f.seek(0) txt_readline = f.readline() print(txt_readli...
2018-05-16 13:27:35 271
原创 python 用random函数生成邀请码,并存储在mysql中
网上的习题,照着别人的代码学习学习,熟悉python。随机生成邀请码,并存储起来。随机:python中的random函数,具体可以看实现方式random.py存储: 可以存在文件中,也可以存在数据库中。这里选择了mysql,具体可以看菜鸟教程 http://www.runoob.com/python3/python3-mysql.html#-*- coding:utf-8-*-#生成邀请码功能...
2018-04-28 14:09:01 1476
原创 python 日期相减得天数差
import datetimedef straight_minus(): date1 = '' date2 = '' flag = 3 while (1): date1 = (input("please input the fisrt date like,format like 20180808: \n\t")) date2 ...
2018-04-24 19:02:10 8850
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人