python
POWERFULU
For man is man and master of his fate.
展开
-
爬虫项目总结
爬虫项目使用手册项目1 爬取ChemicalBook爬取化合物列表爬取代码:chemical.py输出文件: data.xls爬取化合物具体信息爬取代码:pagedata.py输出文件: pagedata.txt1.1 爬取CAS号、中文名、英文名、分子式代码 # -*- coding: utf-8 -*- """ Created on Tue Jul 21 09:49:56 2020 @author: JX """原创 2020-08-31 16:59:07 · 2234 阅读 · 0 评论 -
conda常用的命令
conda常用的命令conda常用的命令conda list查看安装了哪些包 conda env list或conda info -e查看当前存在哪些虚拟环境 conda update conda检查更新当前conda conda --version查询conda版本 conda -h查询conda的命令使用创建虚拟环境conda create -n your_env_name python=X.X(2.7、3.6) conda create -n your_env...原创 2020-06-11 13:00:50 · 222 阅读 · 0 评论 -
Anaconda指南
Anaconda 使用指南概述很多学习python的初学者甚至学了有一段时间的人接触到anaconda或者其他虚拟环境工具时觉得无从下手, 其主要原因就是不明白这些工具究竟有什么用, 是用来做什么的, 为什么要这么做, 比如笔者一开始也是不明白为啥除了python之外我还需要这么一个东西, 他和python到底有啥联系和区别, 为啥能用来管理python.在使用过之后我才逐渐发现其实a...原创 2020-04-10 16:19:38 · 232 阅读 · 0 评论 -
Hadoop3.0 单机伪分布集群安装
Hadoop3.0 单机伪分布集群安装准备环境: 1 台linux 虚拟机(Centos6.x64 位)ip 为:192.168.111.100hostname 为:hadoop100虚拟机基本环境配置:集群用到的所有机器都参考此流程进行配置。 静态 ip 配置# ip 配置信息仅供参考,此处使用的是 nat 网络模式[root@hadoop100 ~]# vi /etc/s...原创 2020-04-08 15:32:21 · 341 阅读 · 0 评论 -
最全解析:大数据和机器学习有什么区别
大数据的定义大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据是一个笼统的概念暂未发现和准确的定义。大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越多的数据会越...原创 2020-04-08 11:57:46 · 557 阅读 · 0 评论 -
初学Python做的的几道练习题
1. 自定义词库,编写敏感词屏蔽函数key = ('我是','你')text = '哈喽!我是你的优乐美!'# 1.使用Python正则表达式的re的sub()函数;# 2.在正则表达式语法中,竖线“|”表示二选一或多选一。import redef check(key,text): return re.sub('|'.join(key), '*',text)print(c...原创 2019-05-23 10:36:29 · 304 阅读 · 0 评论 -
python爬虫——分页爬取京东商城商品信息(手机为例)
1、最近刚开始学习python 写了个爬虫练习,感觉主要是得会用F12查询网站结构代码。还涉及到反爬虫,每个网站都不一样,拿到的解析出的json数据格式也不同。得有些Web知识的基础才行。https://www.bilibili.com/video/av54287470/ 视频讲解2、上代码import urllib.requestimport time# xpath l...原创 2019-05-29 22:33:06 · 4819 阅读 · 2 评论