Python
Xue__Feng
正在西安电子科技大学攻读硕士研究生
展开
-
Python_定义类并详细讲解
类的继承1.私有属性不能被继承例: class Animal(object): def __init__(self, name='animal', color='white'): self.__name = name self.__color = color def __del__(self): print('啊。。。。。。') cla...原创 2019-08-30 21:04:02 · 293 阅读 · 0 评论 -
python制作模块与包
1.制作模块#制作第一个test1模块,直接运行会显示__main__与------------AA-------------def AA(): print("---------------AA----------------")print(__name__)if __name__ == "__main__": AA()#制作第二个test2模块,直接运行会产生__main__与-...原创 2019-09-05 11:16:55 · 890 阅读 · 0 评论 -
python_网络爬虫_urllib
1.域名与IP地址“ 域名----->DNS服务器------>IP地址”你的电脑先把域名传给DNS服务器,通过DNS服务器找到域名所对应的IP地址,在传回你的电脑进行访问。2.调用urllib进行爬取#读取数据import urllibf = urllib.urlopen("http://www.baidu.com")print(f.read())#读取状态pr...原创 2019-09-05 20:38:28 · 102 阅读 · 1 评论 -
python_网络爬虫_正则化选取信息
1.安装正则化模块re2.调用正则提取想要的信息import urllibimport reresponse = urllib.urlopen("http://www.douyu.com")msg = response.read()img = re.findall(r'src="(.*?\.(png|jpg))"',html)3.下载所有图片#接续上面的程序import tim...原创 2019-09-05 21:13:08 · 500 阅读 · 0 评论 -
python_网络爬虫_urllib2
1.URL变化应对#这里应用urlencode把变化对应的值添加到字典里,然后再加到URL上import urllibinf = urllib.urlencode({"w":"python","b":"t"})f = urllib.urlopen("http://www.baidu.com%s"%inf)2.get与post#get方式urllib.urlopen("http://...原创 2019-09-05 22:22:49 · 136 阅读 · 0 评论 -
python_网络爬虫_beautifulsoup
1.安装beautifulsoup下载地址:http://pypi.python.org/pypi/beautifulsoup4/4.3.2官方文档:http://beautifulsoup.readthedocs.org/zh-CN/latest解压安装包:tar zxvf beautifulsoup4-4.3.2.tar.gz进入解压后文件夹安装:python3 setup.py i...原创 2019-09-06 13:06:39 · 109 阅读 · 0 评论 -
jupyter notebook 常见问题:修改路径;浏览器无反应
1.查找配置文件位置当没有把anaconda添加到环境变量,需要通过打开Anaconda Prompt进行操作如果添加到环境变量,直接用cmd就可以进行下面的操作#如上图所示,直接输入命令进行查看,下面出现的就是配置文件所在的路径 jupyter notebook --generate-config2.修改默认位置配置第一步:用sublime等IDE打开配置文件,找到#c.Not...原创 2019-09-10 15:58:14 · 1088 阅读 · 1 评论 -
机器学习-分类
1.监督学习,半监督学习,无监督学习,增强学习1)监督学习样本有标签,即样本有准确的答案用监督学习对新的数据进行分类和回归2)半监督学习一部分数据有标签,一部分数据无标签需要先用无监督学习对数据进行操作,然后再进行有监督学习3)无监督学习样本无标签通常无监督学习可以进行聚类分析和(PCA)降维处理4)增强学习对每次分类结果进行评价,并反馈给模型,是模型进行调整...原创 2019-09-10 23:29:40 · 119 阅读 · 0 评论 -
python_案例_文本数据分析
1.储备知识1)停用词第一点:在文章中大量出现;第二点:对判断没啥大用。2)TF-IDF3)相似度第一步:进行分词;第二步:获取词频向量;第三步:计算向量之间的余弦相似度。<a,b>/(|a|*|b|)2.代码实现import pandas as pdimport jiebadf_news = pd.read_table("./data/val.t...原创 2019-09-11 22:18:08 · 1423 阅读 · 0 评论