python
python知识、工程那些事
大灰狼吃树皮
这个作者很懒,什么都没留下…
展开
-
正则表达式--找到连续的六位数字、括号内的内容
import res1=“123456,122456”s2=“woshi(lihjui)”print(re.findall("[0-9]{6}",s1))print(re.findall("((.+?))",s2))原创 2020-11-19 17:45:31 · 2112 阅读 · 0 评论 -
python操作xls表格csv表格
**excle**#读数据import xlrd;wb=xlrd.open_workbook('1.xlsx');sheet1 = wb.sheet_by_index(0);print(sheet1.cell(0,0).value)#写数据import xlwt;wb = xlwt.Workbook(encoding='utf-8');sheet=wb.add_sheet('test');sheet.write(0,0,'test');wb.save('1.xls');更多:ht原创 2020-11-10 18:52:00 · 141 阅读 · 0 评论 -
python爬虫笔记
定向网络数据爬取和网页解析Requests库:自动爬取HTML页面,自动网络请求提交robots.txt:网络爬虫排除标准Beautiful Soup:解析HTML界面Re库:正则表达式库,提取页面关键信息Scrapy*:网络爬虫原理介绍,专业爬虫框架介绍Requests库的使用方法requests.request()#构造一个请求,支撑以下各方法的基础方法requests.get()#获取HTML网页的主要方法,对应于HTTP的getrequests.head()#获取HTML网页头信息原创 2020-07-10 20:51:45 · 199 阅读 · 0 评论 -
Scrapy.Request 回调函数不执行
1.加上参数dont_filter=True(去重)2.增加是不是allowed_domains范围内的url3.yield Request 改为yield scrapy.http.Request转载 2020-07-10 20:48:10 · 683 阅读 · 2 评论 -
爬取淘宝商品+正则表达式库匹配
#CrowTaobaoPrice.pyimport requestsimport re def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" def par转载 2020-07-09 20:44:55 · 588 阅读 · 0 评论 -
爬虫笔记,中国最好大学网排名实例
'''中国最好大学排名'''import requestsfrom bs4 import BeautifulSoupdef get_HTML_text(url): try: hd={'auth-agent':'Chrome/10'} r=requests.get(url,headers=hd); r.raise_for_status(); r.encoding=r.apparent_encoding; return原创 2020-07-05 13:30:56 · 482 阅读 · 0 评论 -
python中文对齐的解决办法,.format填充中文空格
chr(122288)是中文空格tplt="{0:^10}\t{1:{3}^10}\t{2:^10}";print(tplt.format(ls[0],ls[1],ls[2],chr(12288)))原创 2020-07-05 13:29:17 · 2285 阅读 · 2 评论 -
if __name__ == “__main__“:的作用
if __name__ == "__main__": 代码块文件作为脚本直接运行会运行后面的代码块文件作为模块import 导入到其他程序中不运行后面的代码块原创 2020-07-04 12:42:46 · 198 阅读 · 0 评论 -
python分析文本报告
import jiebaimport wordcloudtxt=open("txt.txt",encoding="utf-8");string=txt.read();txt.close();ls=jieba.lcut(string);words=" ".join(ls);w=wordcloud.WordCloud(font_path="msyh.ttc");w.generate(words);w.to_file("txt.png");'''jieba库、词云库读取数据-分隔成列表-原创 2020-07-02 19:38:05 · 592 阅读 · 0 评论 -
python笔记
power(x,y),x**y,表示x的y次方进制数表示:十进制,二进制0b或0B,八进制0o或0O,十六禁止0x或0X10//3=3整数商round(x,y),四舍五入函数,x是数字,y是保留几位小数;abs()取绝对值;divmod(x,y)输出商和余数,divmod(10,3)=(3,1);pow(x,y[,z])=(x**y)%z复数z,z.real表示实部,z.imag表示虚部;max(x1,x2…)输出最大值;min(x1,x2…)输出最小值int(x)取整数,float(x)取浮点数原创 2020-06-20 21:52:20 · 860 阅读 · 0 评论 -
window下的pyinstaller的安装和使用
安装:pip install pyinstaller使用,在.py文件的目录下运用cmd命令行:pyinstaller yourprogram.py,打包生成一个文件,在dist目录下与py文件同名的可执行文件pyinstaller 常用参数pyinstaller -h 帮助pyinstaller -F生成一个独立的可执行文件pyinstaller --clean清楚打包过程中的临时文件pyinstaller -i <图标文件名.ico>常用语句:pyinstaller -i cu原创 2020-06-17 10:41:33 · 411 阅读 · 0 评论 -
python用turtle绘制七段数码管
分七步画import turtle;def draw_line(j): turtle.pendown() if j==True else turtle.penup(); turtle.fd(100); turtle.right(90);def draw_digit(digit): draw_line(True) if digit in [2,3,4,5,6,8,9] else draw_line(False); draw_line(True) if digit原创 2020-06-16 16:55:03 · 827 阅读 · 0 评论 -
python计算100以内的素数和
def Is_prime(n):#判断素数,该数不能被2到其平方根整除则为素数 k=n**0.5; for i in range(2,int(k)+1): if n/i>int(n/i): continue; #小数大于其取整,不能整除,跳出单次循环 else: return False; return True;count=0;for i in range(2,100): if Is.原创 2020-06-15 09:19:59 · 5579 阅读 · 0 评论