自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

web crawler/python/NLP

  • 博客(37)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

转载 NLP领域期刊介绍

https://blog.csdn.net/m0_37306360/article/details/76006255

2019-08-29 22:28:03 1804 1

原创 tensorflow 安装问题Cannot uninstal1 wrapt'

tensorflowInstalling collected packages: astor, wrapt, tensorf1 owFound existing installation: wrapt 1. 10. 11ERROR: Cannot uninstal1 wrapt' ,It is a distutils installed project and thus we cannot ...

2019-08-29 17:14:41 367

原创 java环境变量的配置

JAVA_HOME创建一个环境变量 JAVA_HOME 记录住jdk的目录。在path中通过%%动态的获取JAVA_HOME的值即可。JAVA_HOME=C:\mysoft\Java\jdk1.7.0_21path=%JAVA_HOME%\bin;%path%%path%:动态获取path环境变量的值。%JAVA_HOME%:动态获取名称为JAVA_HOME环境变量的值使用动态环...

2019-08-28 22:45:39 77

原创 JRE与JDK区别

JRE(Java Runtime Environment Java运行环境):包括Java虚拟机(JVM Java Virtual Machine)和Java程序所需的核心类库等,如果想要运行一个开发好的Java程序,计算机中只需要安装JRE即可。JDK(Java Development Kit Java开发工具包):JDK是提供给Java开发人员使用的,其中包含了jav...

2019-08-28 22:31:16 104

原创 几种语言在爬虫场景下的力量对比

PHP爬虫:代码简单,并发处理能力较弱:由于当时PHP没有线程、进程功能要想实现并发需要借用多路复用模型R语言爬虫:操作简单,功能太弱,只适用于小规模的爬取,不适合大规模的爬取Python爬虫:有着各种成熟的爬虫框架(eg:scrapy家族),可以方便高效的下载网页并且支持多线程,进程模型成熟稳定,爬虫是是一个典型的多任务处理场景,请求页面时会有较长的延迟,总体来说更多的是等待,多线...

2019-08-19 07:50:01 1169

原创 python chardet查看文件编码

# -*- coding: utf-8 -*-# @Author: WangZeling# @Date: 2019-08-18 18:56:31# @Last Modified by: WangZeling# @Last Modified time: 2019-08-18 19:33:45# @E-mail:[email protected] os import ...

2019-08-18 21:24:50 452

原创 ValueError: binary mode doesn't take an errors argument

#with open(PngPath,mode=‘rb’,errors=‘ignore’) as f:with open(PngPath,mode=‘rb’) as f:

2019-08-18 19:23:03 1725

原创 c语言与python容器存放不同元素类型的实现

c语言使用 void * 实现的 类型由头部类型信息的指定确定, 关于 void * :https://blog.csdn.net/qq_41228218/article/details/99404104而python的list就可以做到

2019-08-18 18:38:01 179

原创 NLP之字符串预处理(未完)

s = ' hello, world!'print(s.strip())print(s.lstrip(' hello, '))print(s.rstrip('!'))sStr1 = 'strchr'sStr2 = 'r'nPos = sStr1.index(sStr2)sStr1 = sStr1.upper()sStr1 = sStr1.lower()sStr1 = 'a...

2019-08-17 22:57:42 215

原创 正则表达式在线练习网站

https://alf.nu/RegexGolf

2019-08-17 22:39:35 8180

原创 正则表达式在线验证工具

http://regexr.com/

2019-08-17 22:31:49 875

原创 拉丁语词典

https://latin-dictionary.net/search/latin/formare

2019-08-17 00:31:45 2674

原创 英语单词词源网站

https://www.etymonline.com/

2019-08-15 20:16:33 3685

原创 万能指针步长与普通指针不一样?

#include <stdio.h>int main(int argc, char const *argv[]){ void* p = NULL; int a = 10; p = &a; *((int *)p) = 20; printf("%d\n%d\n", p, p + 1); int a1=10; in...

2019-08-13 09:42:05 219

原创 C 编译器懵逼之万能指针(void * 无类型指针/泛型指针)

#include <stdio.h>int main(int argc, char const *argv[]){ void *p = NULL; int a = 10; p = &a; *((int *)p) = 20;//防止编译器懵逼报错,因为如果不转,对于void *编译器不知道该操作几个字节的内存 printf("%d\n%...

2019-08-13 08:44:57 413

原创 C 空指针的使用

int main(int argc, char const *argv[]){ int *p = NULL;//NULL is zero of macro definition int a = 1; p=&a; if (p!=NULL) { *p=2; } return 0;}

2019-08-12 19:10:53 780

原创 c 语言的多文件编程

helloworld.c#include <stdio.h>int HelloWorld(void){ printf("hello , world "); system("pause"); return 0;}helloworld.h//extern 不分配空间extern int HelloWorld(void);main.c#incl...

2019-08-11 17:10:50 354

原创 c 中char是int的一种

#include <stdio.h>int main(void){ int c; while ((c=getchar()) != EOF) putchar(c); printf(c); return 0;}参考:https://stackoverflow.com/questions/7119470/int-c-getchar《C程序设计语言...

2019-08-10 21:12:35 278

原创 C 冒泡排序

#include <stdio.h>int main(void){ int array[]={5,6,8,2,0,5,9,3}; int n=sizeof(array)/sizeof(array[0]); int i = 0; int j = 0; int temp; for ( i = 0; i < n-1; i++)...

2019-08-10 10:57:08 6954

原创 python IDLE 自带sorting demo

2019-08-10 10:22:59 194

原创 C 用交换法实现数组的反转

#include <stdio.h>int main(void){ int array[]={5,6,8,2,0,5,9,3}; int n=sizeof(array)/sizeof(array[0]); int i = 0;//数组下标 int j = n-1;//数组最后一个 element 下标 int temp ; whi...

2019-08-10 09:56:47 331

原创 goto 不能滥用(会显得代码很乱)

#include <stdio.h>int main(void){ goto tohere; printf("1111111"); tohere: printf("2222222"); return 0;}

2019-08-10 09:33:24 687

转载 Daily English reading

http://www.chinadaily.com.cn/business

2019-08-08 17:49:09 161

原创 c 中各个进制变量的赋值与打印

#include <stdio.h>int main(void){ int a = 12;//十进制方式赋值 int b = 012;//十进制方式赋值 int c = 0xAB;//十进制方式赋值 printf("%d\n",a);//十进制方式赋值 printf("%o\n",b);//十进制方式赋值 printf("%x\n"...

2019-08-08 14:12:23 255

原创 c语言中变量的定义与声明的区别

定义:分配了空间声明:外来的(extern)没有分配空间,声明后不能直接赋值#include <stdio.h>int main(void){ extern int c; c = getchar();//err int c return 0;}

2019-08-08 13:55:50 234

原创 windows DOS 常用工具命令

2019-08-08 10:56:33 323

原创 windows 与linux 中文乱码问题及 EditPlus 编码转换

windows下可以默认正常显示的中文编码:gbk gb2312 ANSIlinux 默认为utf-8

2019-08-08 10:43:15 470

原创 强大的VS code之c/c++配置使用教程

about file icon:简体中文包,安装后重启即可:MinGW配置模板参考微软官方md文档https://github.com/microsoft/vscode-cpptools/blob/master/Documentation/LanguageServer/MinGW.md文件结构:VS code是基于基于编程环境文件夹的设计理念, 根据.vscode文件夹下的配...

2019-08-06 19:09:10 11208 2

原创 K&R C github code

https://github.com/caisah/K-and-R-exercises-and-examples

2019-08-05 20:09:13 340

原创 颈椎保护

颈椎病实质:颈椎长时间受力不均匀导致增生,一般积累折磨颈椎10年就会得颈椎病,所以一般从中年人开始得颈椎病买个护颈椎的枕头(主要减少颈椎的压力,而不是头)每工作半个小时就用脑袋在空中画个田字参考:得到 卓克 311 科学思维课...

2019-08-05 16:17:47 206

原创 selenium geckodriver:Tried to run command without establishing a connection解决

selenium.common.exceptions.InvalidSessionIdException: Message: Tried to run command without establishing a connection去掉browser.close()即可import timefrom selenium.common.exceptions import TimeoutExce...

2019-08-05 10:51:31 6019 1

原创 python文件操作 f0.writelines(f.readlines()[6]) IndexError: list index out of range解决

if 'c.youdao.com' in f.readlines()[6]: 改为 url1=f.readlines()[6] if 'c.youdao.com' in url1:解决

2019-08-05 10:11:49 1075

原创 html2text-------------getting text from a page of HTML into clean

https://pypi.org/project/html2text/import timefrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.support.wait import WebDriverWaitfrom requests.exceptions import Reques...

2019-08-05 09:27:32 244

原创 python 递归实现多个文件夹下多文件内容的合并

import osimport chardetpath=r''def func(path): size_sum = 0 name_lst = os.listdir(path) for name in name_lst: path_abs = os.path.join(path,name) if os.path.isdir(path_a...

2019-08-02 21:24:35 751

原创 sublime text3 :TabError: inconsistent use of tabs and spaces in indentation解决

2019-08-02 21:13:44 401

原创 Visual Studio Code 之 python hello world

新建py文件后插件安装提示会自动弹出

2019-08-02 15:58:21 580

原创 GitHub awesome public datasets

https://github.com/awesomedata/awesome-public-datasets

2019-08-02 14:48:50 3190

大数据开发各基础组件(Linux)

apache-hive-2.1.1-bin.tar.gz hadoop-2.7.3.tar.gz hbase-1.2.4-bin.tar.gz jdk-8u171-linux-x64.tar.gz zookeeper-3.4.10.tar.gz

2019-02-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除