学习
守云开见月明
这个作者很懒,什么都没留下…
展开
-
熵,隐马尔可夫,最大熵模型,维特比算法,前向算法的通俗解释,附部分代码
什么是熵(Entropy)简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量被温度除的商。负熵是物质系统有序化,组织化,复杂化状态的一种度量。熵最早来原于物理学. 德国物理学家鲁道夫·克劳修斯首次提出熵的概念,用来表示任何一种能量在空间中分布的...转载 2018-04-11 10:12:11 · 431 阅读 · 0 评论 -
ubuntu 安装过程中 安装界面卡死完美解决办法 笔记本
在安装ubuntu过程中,由于是神舟电脑,问的淘宝客服,没想到比我还白,在网上搜了资料,总结如下:1 设置优盘启动 这里就不多说了,网上资料很多,找个工具直接写进u盘就好。2 u盘启动过程中,会出现选择界面,try ubuntu 、install ubuntu等,此时点“e”键,会出现一个黑框,此时在倒数第二行左右,找到quiet splash - - - 改成 quiet splas...原创 2019-07-05 09:18:53 · 53502 阅读 · 30 评论 -
pycharm出现 Pycharm this applicatation failed to start because it could not find or laod the qt 的解决办法
通常这种情况会出现在pycharm中运行图形界面时出错,在我这idle是可以运行。通过在cmd窗口中pip check matplotlib发现 matplotlib中依赖包的问题。更新其中的依赖包,问题解决。...原创 2019-06-27 10:04:43 · 2414 阅读 · 0 评论 -
int /'float' object is not callable 问题完美解决(单次能执行,一循环调用就出错)
遇见这种问题几次,编译器一直定位不到错误,刚开始以为是自己的算法问题,在逐步调试加入continue之后,发现在某一行之前程序都能正常运行,到某一行就出现问题。报这种错误,一般都在循环中,单次执行时程序没有问题,这种都是程序参数命名和系统关键字重复所致解决办法:查找程序,看有哪些参数名字命名为系统关键字,改正即可。...原创 2019-06-12 08:30:37 · 5567 阅读 · 0 评论 -
倒排索引原理 搜索引擎
在搜索引擎中每个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合(实际上在搜索引擎索引库中,关键词也已经转换为关键词ID)。例如“文档1”经过分词,提取了20个关键词,每个关键词都会记录它在文档中的出现次数和出现位置。得到正向索引的结构如下: “文档1”的ID > 单词1:出现次数,出现位置列表;单词2:出现次数,出现位置列表;…………。 “文档2”的ID >...转载 2019-05-22 09:15:07 · 598 阅读 · 0 评论 -
ubuntu安装google浏览器
依次执行下面命令: sudo wget http://www.linuxidc.com/files/repo/google-chrome.list -P /etc/apt/sources.list.d/wget -q -O - https://dl.google.com/linux/linux_signing_key.pub | sudo apt-key add -sudo apt u...转载 2018-12-19 18:53:46 · 1048 阅读 · 0 评论 -
python3 scrapy 爬取腾讯招聘,数据存为Json格式
程序主要代码:(tencentPosition.py)# -*- coding: utf-8 -*-import scrapyfrom tencent.items import TencentItemclass TencentpositionSpider(scrapy.Spider): name = "tencent" allowed_domains = ["tenc...原创 2018-11-27 21:07:23 · 372 阅读 · 0 评论 -
selenium+chromedrive 爬取js加载的动态网页(下拉才能显示内容)
from selenium import webdriverfrom selenium.webdriver.common.keys import Keys #调用键盘操作from selenium.webdriver.chrome.options import Optionsimport timefrom lxml import etree#创建chrome浏览器驱动,无头模式...原创 2018-10-15 16:06:00 · 6438 阅读 · 8 评论 -
正则表达式获取a便签内的href链接举例(a标签内容是可变的)
pattern = re.compile(r'<a\b[^>]+\bhref="([^"]*)"[^>]*>' + str(link_text) + '.*?</a>')result = pattern.search(html)# print(result.group(1))result_url = result.group(1) #页面内的...原创 2018-10-11 19:23:03 · 12746 阅读 · 4 评论 -
python3 实现百度贴吧html页面的获取
1.获取输入贴吧的HTML页面2.放到对应的文件中代码:from urllib.parse import urlencode,unquoteimport urllib.requestimport randomimport sysdef tiebaSpider(url,beginpage,endpage): #百度爬虫接口三个参数 url,起始页,终止页 for page in ...原创 2018-06-11 10:58:29 · 149 阅读 · 0 评论 -
python调用cmd进行输入输出
由于程序需要用java和python混用,所以可以取巧,就是在python中调用cmd,在cmd中执行java所以,进行了一下测试。完美运行import oswith open("text1.txt","w",encoding="utf8") as file1: mystr = os.popen("ipconfig") # popen与system可以执行指令,popen可以接受...原创 2019-07-05 14:22:04 · 9503 阅读 · 0 评论