实习/项目
哈士猪
这个作者很懒,什么都没留下…
展开
-
UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xf6‘ in position 115: illegal multibyte seq
**项目中需要获取接口中的关键词信息并存在字典中再导入数据库,某些数据中出现UnicodeEncodeError的报错,显示有些数据’gbk’无法编码。之前遇到数据中有韩文也会这样报错的问题,但好像日文可以。这次查看了数据发现是因为数据包含如下字符ö具体解决方法按照网上所说修改utf-8会造成原本正常的中文无法显示,gbk18030也无法识别这个字符。最后发现其实这个错误只会在print才会出现,而直接加入字典是不会报错的。我print只是作为检查用,其实导入数据库只需要直接将字典INSERT IN原创 2021-06-23 14:03:14 · 612 阅读 · 0 评论 -
导入字典到数据库引号报错问题
项目需要将接口的部分信息保存到数据库,提高运行和推荐机制的效率。在得到想要的字典列表后导入数据库遇到了一些问题。text = {'id': 'resourcetype_476_1333_44698', 'scholar': ['1145'], 'keywords': ['航空发动机', '[890463]叶片', '[3119081]侵彻', '[5650749]机匣', '[7400469]包容性', '数值仿真', '叶片', '侵彻', '机匣', '包容性', 'aeroengine', 'bl原创 2021-06-23 13:49:15 · 230 阅读 · 0 评论 -
糖尿病诊断模型训练与结果预测
数据来源:github ==>> diabetes.csv第一步 导入数据import pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import classification_report, confusion_matrix, accuracy_scorefrom s原创 2021-03-12 17:19:07 · 2784 阅读 · 3 评论 -
最初级的糖尿病数据
数据来源中国糖尿病患者群体特征调查报告2020 from 糖护士http://www.dn258.com/18178.htmlU.S. Department of Health and Human Serviceshttps://www.cdc.gov/diabetes/pdfs/data/statistics/national-diabetes-statistics-report.pdf# -*- coding: utf-8 -*-import pymysql# 使用的是MySQL本地数原创 2021-03-02 18:11:32 · 355 阅读 · 0 评论