- 博客(9)
- 收藏
- 关注
原创 如何在requests session 中手动设置cookies
在编写流量包的监控程序时需要使用cookie模拟用户登陆,用来获取页面数据。使用requests库添加cookies后,运行出现401错误,发现模拟登陆没有成功。按道理说cookies本身就包含了session的内容。。。 后来在session中设置cookies后,使用session.get()就能实现这个功能了。import requestsurl = 'https://brain...
2018-07-20 15:36:32 4687
原创 Mac安装git出现错误解决办法
Mac安装 git 出现错误提示:xcrun: error: invalid active developer path (/Library/Developer/CommandLineTools), missing xcrun at: /Library/Developer/CommandLineTools/usr/bin/xcrun** 原因/;缺少Xcode插件 解决办法:xcode-sel...
2018-07-17 14:04:38 2959
原创 python 搭建虚拟环境
在ubuntu上执行以下命令,来保证所有的包都是最新的sudo apt-get updatesudo apt-get ungrade1.安装pip apt-get install python-pip2.检查安装的pip版本 pip -V3.创建python虚拟环境 virtualenv sudo pip install virtualenv4.
2017-05-29 11:46:01 343
原创 对泰坦尼克号案例进行数据挖掘
1.基本概念对历史数据的计算,对未来还没有发生的事情做预测。训练集:训练模型测试集:测试模型好坏验证集:选择参数(如何通过验证集来选择参数?)将历史数据划分为以上三个部分。建立模型时如何知道模型的好坏:评估标准评估标准:优化代价函数J(theta)误差平方和,目标就是优化代价函数,使之达到最小。
2017-05-23 15:22:58 1529
原创 树回归
CART(Classifovation And Regression Trees),分类回归树该算法既可以用于分类也可以用于回归。分类树输出的是样本的类标,回归树输出的是一个实数(例如房子的价格,病人在医院待的时间等)。分类回归树是一棵二叉树,每个非叶子结点都有两个孩子,所以对于第一棵子树,其叶子结点比非叶子结点树多一。
2017-05-20 20:16:23 271
转载 知识图谱
[核心提示] 当你尝试搜索“冰桶挑战”,是什么决定你在搜索引擎上看到的内容呢,移动互联网时代,搜索引擎如何才能足够精准、个性化呢,这背后需要一个共同的作用机制:知识图谱最近 # 冰桶挑战 # 挺火的,好奇心驱使我百度一下,看到如下结果:可能是做搜索的职业习惯的缘故,灿辉在想:百度是怎么直接显示出我最想看到的名人冰桶挑战视频的呢? 其实背后就是知识图谱在起作用,今天灿
2017-05-18 18:18:41 1039
转载 如何利用Python对中文进行分词处理
python做中文分词处理主要有以下几种:结巴分词、NLTK、THULAC1、fxsjy/jieba结巴的标语是:做最好的 Python 中文分词组件,或许从现在来看它没做到最好,但是已经做到了使用的人最多。结巴分词网上的学习资料和使用案例比较多,上手相对比较轻松,速度也比较快。结巴的优点:支持三种分词模式 支持繁体分词 支持自定义词典 MIT 授权协议 2
2017-05-15 15:55:10 9239
转载 机器学习
介绍机器学习很复杂。你可能会遇到一个令你无从下手的数据集,特别是当你处于机器学习的初期。在这个博客中,你将学到一些基本的关于建立机器学习模型的技巧,大多数人都从中获得经验。这些技巧由Marios Michailidis(a.k.a Kazanova),Kaggle Grandmaster在2016年3月5日现在排名第3位的在线研讨会上共享的。在线研讨会有三个方面:1.视频(
2017-05-15 10:22:05 555
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人