Python
主要是使用Python处理的各项问题,和Python知识点学习
悄悄不加糖
”勇气是解决大部分问题的答案。“|互联网搬砖ing|自我成长|学习记录
展开
-
Pytorch环境配置及安装
这学期最期待的课《自然语言处理》要开课啦!!!时隔多月总算想起来CSDN很久没发学习记录啦~老师安排课前工作安装 anaconda https://www.anaconda.com/distribution/安装 nltk安装 pytorch安装 notepad++或者ultraedit等文本编辑工具作为一名爱学(ting)习(hua)的同学,当然要积极配合老师!以下按照内容如果大家已完成可选择自己需要的部分参考~anaconda下载及安装官网下载anaconda官网,如果网速不是很快可原创 2021-05-19 22:57:48 · 336 阅读 · 0 评论 -
python之emoji表情处理
emoji库安装直接pip install emoji我使用的是pycharm,所以直接从pycharm中安装的emoji库示例源数据:(数据是瞎编的哈)emoji库主要有两个函数:emojize()——>生成emoji表情demojize()——>emoji表情解码>> import emoji>> print(emoji.emojiz...原创 2020-04-02 18:19:58 · 8749 阅读 · 4 评论 -
python生成随机数的几种方法
最近在听北邮陈光老师在B站的《python编程与实践》《Python编程与实践》第二课 by 北邮陈光课程是面向初学者的,不过我很喜欢陈老师在开课之前的一些方法论。以下皆是陈老师课程中给出学习语言的建议:多思考【多总结、多拓展、多联想】学习编程最好的方法就是编程【用编程去检验知识、以问题为线索编程】克服拖延、怠慢【爱上Ta、现在就去做、如果觉得没意思就去找意思、水到自然渠成因而不必焦虑,...原创 2020-03-06 21:32:14 · 11062 阅读 · 0 评论 -
python爬虫(五)
实战实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容。丁香园论坛:http://www.dxy.cn/bbs/thread/626626#626626 。解析默认的登录方式是扫码登录,所以要切换成账号密码登录:通过selenium定位元素登录链接login_link = driver.find_element_by_link_text(‘登录’)把login...原创 2019-08-12 16:49:26 · 222 阅读 · 0 评论 -
python爬虫之selenium(四)
任务安装selenium并学习。使用selenium模拟登陆163邮箱。163邮箱直通点:https://mail.163.com/步骤1.安装selenium我使用pycharm,所以直接在pycharm原创 2019-08-10 19:58:39 · 136 阅读 · 0 评论 -
python爬虫基础(一)
get与post了解get与post之前,首先对HTTP协议有些了解超文本传输协议(HTTP)的设计目的是保证客户机与服务器之间的通信。HTTP 的工作方式是客户机与服务器之间的请求——应答协议。web浏览器可能是客户端,而计算机上的网络应用程序也可能作为服务器端。 举例:客户端(浏览器)向服务器提交 HTTP请求;服务器向客户端返回响应。响应包含关于请求的状态信息以及可能被请求的内容。...原创 2019-08-06 19:24:58 · 239 阅读 · 0 评论 -
python 爬虫Xpath(三)
XpathXPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 使用路径表达式来选取 XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。...原创 2019-08-08 20:03:49 · 184 阅读 · 0 评论 -
python爬虫BeautifulSoup(二)
BeautifulSoupBeautiful Soup: Python 的第三方插件用来提取 xml 和 HTML 中的数据,官网地址 https://www.crummy.com/software/BeautifulSoup/案例网站:网页源代码:# coding:utf-8#导入BS库和requests库from bs4 import BeautifulSoupimport...原创 2019-08-08 19:03:04 · 171 阅读 · 0 评论 -
python练习——模式匹配与正则表达式
在行为心理学中,人们把一个人的新习惯或理念的形成并得以巩固至少需要21天的现象,称之为21天效应。这是说,一个人的动作、或想法,如果重复21天就会变成一个习惯性的动作或想法。第一个21天,我想用python开始这个计划没有中间商赚差价,买卖双方直接进行交易!好啦,开始今天的学习φ(* ̄0 ̄)正则表达式正则表达式,简称为regex,是文本模式的描述方法。例如,\d是一个正则表达式,表示一...原创 2019-04-02 21:43:56 · 218 阅读 · 0 评论 -
python练习——读写文件
对于不同的操作系统,文件目录会有不同,对于Linux而言,“万事万物皆文件”,对Windows而言,文件读写也很重要。常用文件查询语句import os#拼接路径os.path.join('usr','bin','spam')#返回路径:'usr\\bin\\spam'两个倒斜杠等价于一个正斜杠#获得当前工作目录os.getcmd()#相对路径..\#绝对路径C:\(就是要指...原创 2019-04-10 17:57:13 · 180 阅读 · 0 评论 -
python报错记录N0.3
Error tokenizing data. C error: Expected 1 fields in line 4, saw 2在使用pandas包时,我用的read_csv()读取excel文件,显示错误,因为csv文件不可以是unicode编码的,要是ANSI,解决方案:换用方法为read_excel()参考博客:Python编码格式导致的csv读取错误(csv.reader, pan...原创 2019-03-28 23:38:30 · 186 阅读 · 0 评论 -
聚类分析实验(二)matplotlib绘图可视化
matplotlib是python一个很强大的绘图工具,因为项目的最后要实现将聚类结果可视化输出,所以先学习了一下matplotlib的基本操作。分享一份很细致地matplotlib可视化教程始终不忘初心的博客参数axex: 设置坐标轴边界和表面的颜色、坐标刻度值大小和网格的显示 figure: 控制dpi、边界颜色、图形大小、和子区( subplot)设置 font: 字体集(font...原创 2019-03-28 23:37:18 · 3947 阅读 · 0 评论 -
聚类分析实验(一)数据预处理
咚咚咙咚锵,总算,我做完了实验,可以开始写…博客了o( ̄▽ ̄)o,现在进入正题,要实验验证聚类分析算法,第一步就是(^_~)获取数据数据搜集在进行正式的实验前,需要获取数据,我是用的是博主共享的开源数据25个常用的深度学习开源数据集从blogger.com收集到的19,320名博主的博客,其中博主的信息包括博主的ID、性别、年龄、行业及星座。当然如果各位对于爬虫感兴趣,也可以抓取网站上的用户...原创 2019-03-26 20:37:25 · 10323 阅读 · 0 评论 -
python报错记录No.2之(No module named 'xml.etree'; 'xml' is not a package)
报错截图文件中并没有用到这个模块,为什么报错了呢?于是我百度了一下,有位大佬的解释很容易明白 No module named etree.ElementTree问题解决方法考虑import模块导入加载的顺序。python首先查找当前路径、然后查找lib目录、site-packages目录(Python\Lib\site-packages)和环境变量PYTHONPATH设置的目录。也就...原创 2019-03-21 09:05:32 · 7897 阅读 · 4 评论 -
python报错记录No.1
实验记录实验内容:电商产品评论数据情感分析错误ROSTCM6情感分析结果乱码解决方案:ROSTCM6要求输入文件为ANSI编码,使用python语言转码import pandas as pdinputfile = 'D:/pycharm/comment.txt' #评论文件outputfile = 'D:/pycharm/comment1.txt' #评论处理后保存路径da...原创 2019-02-21 21:59:36 · 968 阅读 · 1 评论 -
Spder+机器学习算法记录(一)
如何导入库?在conda prompt 里输入conda install +包名,运行即可上面那条命令适用与conda包中已有的库,如果没有下载,可以使用pip install+包名原创 2018-10-09 20:23:03 · 346 阅读 · 0 评论