学习
恒情话*hui蜀黍
这个作者很懒,什么都没留下…
展开
-
对redis持久化理解
我们经常会遇到redis持久化的问题,为了自己便于理解,分享一点自己看书的心得!!!redis持久化的几种方式1、前言Redis是一种高级key-value数据库。它跟memcached类似,不过数据可以持久化,而且支持的数据类型很丰富。有字符串,链表,集 合和有序集合。支持在服务器端计算集合的并,交和补集(difference)等,还支持多种排序功能。所以Redis也可以被看成是一个数据结...原创 2019-02-15 21:25:05 · 193 阅读 · 0 评论 -
You are using pip version 9.0.1, however version 19.0.2 is available. You should consider upgrading
在windows下使用pip安装时出现提示:You are using pip version 9.0.1, however version 19.0.2 is available.You should consider upgrading via the ‘python -m pip install --upgrade pip’ command.说明pip版本太低,这时需要使用pytho...原创 2019-02-16 13:37:59 · 21534 阅读 · 4 评论 -
简单爬虫爬取豆瓣电影信息
简单爬虫程序爬取豆瓣电影信息1.整体思路,写注释2.根据注释实现具体步骤,建议在每一步功能都定义成类方法,然后直接在run方法中调用,这样代码就比较规整,看思路只需要看run里面的内容就OK了3.完整代码4.得到数据后就可以对需要的数据进行处理了...原创 2019-02-13 13:35:46 · 1109 阅读 · 0 评论 -
系统机器学习(一) ----sklearn概念和API
skearn接口包含:<分类,回归,聚类> ++ <特征工程> ++ <模型选择,调优> 等一.特征工程 1.特征工程包含(特征抽取,特征预处理,特征降维) 1️⃣.特征抽取(我的理解:将特征(文本或者图像)提取为机器能看懂的数字特征) A.字典特征抽取(特征离散化) ...原创 2019-05-10 22:38:00 · 321 阅读 · 0 评论 -
多线程----使用线程池爬取二手房信息
最开始采用单线程,但是总共要爬取100页共计6000多个html数据,效率特别低,临时学习了一下线程池,非常好用直接上代码:import urllib.requestfrom lxml import etreeimport threadpoolimport sslssl._create_default_https_context = ssl._create_unverified...原创 2019-05-12 02:50:25 · 303 阅读 · 0 评论 -
出现cannot import name 'main'的错误信息
ImportError: cannot import name ‘main’最近在使用scrapy框架,但是在运行scrapy的时候,出现openSSL的问题,在网上查看答案,是因为版本不兼容,需要卸载重新安装。但是在执行sudo pip3 uninstall pyopenssl 时,又出现了ImportError: cannot import name 'main’的问题,详情如下:wu@u...原创 2019-06-29 17:56:19 · 1475 阅读 · 0 评论 -
django操作已有数据库
近期需要用django快速搭建一个后台管理,数据库已经存在。大家都知道django是通过models模型类来产生映射对应关系的。如果参照数据库去自己写models,未免太麻烦了。这里只需要几条命令就能实现,特此记录一下。第一步:python manage.py inspectdb第二步:python manage.py inspectdb > models.py# 这里的mode...原创 2019-07-31 15:22:54 · 867 阅读 · 0 评论