pyquery解析库介绍

PyQuery库是一个强大的网页解析库,在很多方面会比beautifulsoup更优。PyQuery 是 Python 仿照 jQuery 的严格实现,语法与 jQuery 几乎完全相同。 基本用法 html_doc = """ <html&gt...

2019-06-01 15:08:03

阅读数 18

评论数 0

一文梳理正则表达式常用方法

正则表达式,又称规则表达式**。**(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一...

2019-05-30 13:51:45

阅读数 14

评论数 0

python可视化:一些常用绘图脚本

个人整理的一些常用的绘图脚本,基于python的可视化库: matplotlib和seaborn。 1. BARPLOT fig = plt.figure(figsize=(12,8)) ax = fig.add_subplot(1,1,1) a = [0.91, 2.29, 3] b = [1...

2019-05-24 09:49:58

阅读数 44

评论数 0

更好的使用Jupyter notebook

Running a notebook server Running a notebook server 步骤: 在阿里云后台,打开相应的端口,比如我们这里打开8055端口 安装完jupyter后,输入$ jupyter notebook --generate-config产生配置文件。 进入ip...

2019-03-18 14:56:09

阅读数 50

评论数 0

git快速入门梳理

Intro 工作区Workspace:就是你在电脑里能看到的目录,即你代码放的那个文件夹。即时性强,对文件的所有更改都会立刻提现在这里。 版本库:工作区有一个隐藏目录.git,这个不算工作区,而是Git的版本库。 暂存区 Index / Stage:git add以后,当前对文件的更改会保存到这...

2019-03-16 17:13:31

阅读数 27

评论数 0

保存机器学习模型到本地——pickle和joblib

from sklearn.linear_model import LogisticRegression from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split ...

2018-09-03 21:25:24

阅读数 531

评论数 0

Python中的时间模块:datetime

Unix时间戳: 在 1971 年,《Unix Programmer’s Manua》出版,将格林威治时间(GMT)1971年1月1日0时0分0秒作为系统的起始时间。后来为方便记忆和计算,起始时间修改成 1970 年。现今的计算机系统,或多或少受 Unix 的影响,延续 Unix 的计时方式。从此...

2018-09-02 14:32:17

阅读数 196

评论数 0

Sublime Text3 for mac 中文乱码问题解决方案

1、 快捷键【ctrl+`】打开输入框,或者点击View > Show Console menu,然后输入: import urllib.request,os,hashlib; h = '6f4c264a24d933ce70df5dedcf1dcaee' + 'ebe013...

2018-08-30 11:01:44

阅读数 134

评论数 0

matplotlib中文字符乱码问题解决方案

之前在Windows上,遇到matplotlib在画图时,出现中文乱码的问题。解决方案很简单,只需在脚本前加上: import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=[u'SimHei'] #用来正常显示中文标签 p...

2018-08-28 22:52:37

阅读数 132

评论数 0

if __name__=="__main__"

if __name__=="__main__": main() 一个python的文件有两种使用的方法: 直接作为脚本执行 import到其他的python脚本中被调用(模块重用)执行 因此if __name__=="__m...

2018-08-26 18:01:53

阅读数 66

评论数 0

Common Codes

powershell,管理员权限运行代码: Start-Process powershell -Verb runAs

2018-07-18 15:24:07

阅读数 78

评论数 0

陆奇——百度内部Engineering Leadership Talk

Believe in 技术、站在巨人的肩膀上做创新、追求Engineering Excellence、每天学习、Ownership,陆奇送给每一位工程师的建议。 1 Believe in 技术 首先要相信技术,我刚才已经讲了,整个我们工业界,特别是像百度这样的公司,对技术坚定的、...

2018-05-19 16:54:09

阅读数 136

评论数 0

醍醐灌顶与发人深省的言论

1.看杜子建如何剖析为什么互联网时代你还在穷

2018-05-19 16:48:59

阅读数 115

评论数 0

Python Pandas 总结

Pandas 常用的数据结构为: Series(一维数组),DataFrame(二维数组) 1. Series(一维数组) import pandas as pd import numpy as np n=np.random.randn(5) # 创建一个随机 Ndarray 数组 i...

2018-05-02 02:04:09

阅读数 358

评论数 0

Python爬虫-BeautifulSoup 库

原始的HTML文本:html_doc html_doc = """ <html><head><title>T...

2018-04-21 22:53:30

阅读数 120

评论数 0

Python爬虫-Requests库

1.安装: 在你的终端中运行这个简单命令即可: pip install requests 2.常用代码: import requests r = requests.get(url, params=None, **kwargs) ########################...

2018-04-21 22:38:26

阅读数 111

评论数 0

借助Python爬虫批量下载数据——以NASA和NOAA科研数据为例

1. 无需登录的页面,下载文件: 下载: NOAA-CIRES 20th Century 2m气温再分析资料 但是资料实在的太多了,一个个点手会点残,这时候可以借助Python来批量化下载数据。 打开页面,按F12查看网页源码。 可以看出,对应下载文件的链接都在div标签下的a标签中,...

2018-04-17 15:53:49

阅读数 3365

评论数 0

Principles

1.不要总是自我陶醉,陷入自己很强的幻觉,多想想那些更强大的人,更完美的人。 2.收起自己的锋芒,谨言慎行。与人为善,与亲人为善。 有个性,有想法,不一定非要表达出来,甚至强加于人才爽快,很多想法放在自己的内心世界就足够了,不要尝试改变别人,会带来不必要的麻烦和困扰,而且,有锋芒的样子真的不可...

2018-04-09 16:15:32

阅读数 63

评论数 0

看过的TED收藏与推荐

1. The first 20 hours – how to learn anything | Josh Kaufman | TEDxCSU The major barrier to skill acquisition is not intellectual … it’s emotio...

2018-04-03 09:57:21

阅读数 114

评论数 0

Learn Blockchain in 2 months

Learn_Blockchain_in_2_months This is the code for “Learn Blockchain in 2 Months” by Siraj Raval on Youtube Overview This is the code for this v...

2018-04-02 09:50:49

阅读数 100

评论数 0

提示
确定要删除当前文章?
取消 删除