python
文章平均质量分 60
爬虫等基础内容
youhahhhh
呆头呆脑却义无反顾
展开
-
【pandas】将单元格中的多个数据拆分为多行数据(explode),以csv文件为源文件进行处理
【pandas】将单元格中的多个数据拆分为多行数据(explode)1.原始数据(test.csv)2.需求将“别名”、“科目”这两列中带有多个数据的单元格拆分成多行数据,并将带有空值的行删除,然后另存储为csv文件3.代码import pandas as pdimport numpy as np#导入数据data = pd.read_csv('test.csv') #将单元格中的多个数据拆分为多行数据(用explode方法)labels = ['别名','科目']for la原创 2022-03-04 11:52:31 · 2796 阅读 · 0 评论 -
首次接触WordCloud,numpy,PIL,matplotlib画出一张带“字”的图,还挺有趣
WordCloud,numpy,PIL,matplotlib画出一张带“字”的图# coding=utf-8# @author: yyh# @time : 2020/10/30 19:39import jieba # 分词from PIL import Image # 图像处理import numpy as np # 矩阵运算from wordcloud import WordCloud # 词云from matplotlib import pyplot as plt # 绘图原创 2020-10-31 10:34:04 · 171 阅读 · 0 评论 -
(综合小项目)用python爬豆瓣电影T250,总结bs4,re,xlwt,sqlite知识点
用python爬豆瓣电影T250,总结bs4,re,xlwt,sqlite知识点源码如下:# coding=utf-8# @author: yyh# time on: 2020/10/27 13:19# import bs4from bs4 import BeautifulSoup # 网页解析,获取数据import re # 正则表达式,文字匹配import urllib.request, urllib.error # 指定url,获取网页数据import xlwt # 进行ex原创 2020-10-29 12:07:56 · 516 阅读 · 0 评论 -
python:bs4,xlwt,re,sqlite3模块的引入(基础部分),其中,xlwt用来实现了一个九九乘法表,这四个模块放一起,可以实现简单的网页爬虫
python:bs4,xlwt,re,sqlite3模块的引入,其中,xlwt用来实现了一个九九乘法表,这四个模块放一起,可以实现简单的网页爬虫:将爬取到的有用信息放入excel表中,或者放入数据库了一、首先,引入美味汤汁:from bs4 import BeautifulSoup# coding=utf-8# @author: yyh# time on: 2020/10/27 20:54from bs4 import BeautifulSoupfile = open('./baidu.ht原创 2020-10-29 11:54:44 · 363 阅读 · 0 评论 -
用pycharm创建一个flask框架
初学,用pycharm创建一个flask框架from flask import Flaskfrom flask import render_template # 为返回html文件准备app = Flask(__name__)@app.route('/')def hello_world(): return 'Hello World!'''' flask框架预备知识: 1. flask包含Werkzeug(帮助找到路径)、Jinja2(返回啥!!(如html))原创 2020-10-29 11:32:45 · 1458 阅读 · 0 评论