- 博客(8)
- 资源 (5)
- 收藏
- 关注
原创 python +selenium 爬取淘宝网商品信息
前几天用python爬取豆瓣关于电影《长城》的影评,发现豆瓣的网页是静态的,心中一阵窃喜。以为对于动态网页了解的不是太多。但是主要是用cookie加headers爬取的。效果还不错,爬取了六七万条网友的评价,后期主要打算研究一下,如何发现那些用户是水军。今天研究了动态网页的爬取,主要是爬取的淘宝网上商品信息。主要是用到了selenium库。主要是实现一下几个步骤: (注释)用到的pytho
2016-12-31 17:01:49 6019 1
原创 MATLAB 保存图片变黑色
今天用MATLAB作图,碰到一个问题:想把结果保存成为图片,结果,失望,保存之后打开一片黑色。之后再试了几下,不论是jpg,bmp还是png都不行 只好Google,最后,总算找到答案,原来是着色属性的问题,修改其实很简单: set(gcf, 'Renderer', 'ZBuffer') 这样,就把属性
2016-12-21 13:12:21 7466 1
转载 kernel PCA
PCA不进行分类的动作,而只做做数据预处理,将样本变换到一个容易分类(向最大化方差的方向,principal component axes,投影)的更低维的新的特征空间中。Kernel PCA比PCA多了一步,也即先升维(RBF包括多项式核均是升高到无穷维)再进行投影的动作,因为有些非线性可分的数据集只有在升维的视角下才线性可分。PCA均值化的数据: ∑ixi=0#
2016-09-19 18:32:57 1008
原创 python求各种距离公式
今天一个偶然的机会体会到了python数据运算的强大。求一个数组各样本之间的距离仅简单的几句代码就行。看来真的技术改变世界啊。废话不多说,记下来怕以后忘记。 from scipy.spatial.distance import pdist, squareform下面结合API文档标注一下具体用法:1.X = pdist(X, 'euclidean')计算数组X样本之间的欧式距离 返回值为
2016-09-19 17:01:29 12236 3
原创 快速排序 python
原理讲解 转自 点击打开链接快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。总的说来,要直接默写出快速排序还是有一定难度的,因为本人就自己的理解对快速排序作了下白话解释,希
2016-08-30 23:01:21 630
转载 Java+MySql图片数据保存与读取的具体实例
创建表:create table img_table(img_id int not null auto_increment primary key,img_name varchar(10) comment'名字',img_data mediumblob):图片流存取工具:package com.lijianrong.Mysql.cn;import java.io.File;
2016-07-17 21:27:11 949
原创 java 与数据库连接 实现用户的注册和登录
package com.lijianrong.Mysql.cn;import java.awt.*;import java.awt.event.*;import javax.swing.*;import java.util.*;import java.io.*;import java.sql.*;/** *作者:rong * 功能:与数据库中的用户数据进行匹配 匹配成功的话显示成
2016-07-17 19:40:17 23194 6
转载 java 实现简单的日历查询
import java.text.DateFormat;import java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import java.util.GregorianCalendar;import java
2016-01-22 20:02:34 737
Swiss roll dataset
2016-09-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人