Rstudio自定义主题
R语言自定义主题,主题文件内代码是根据spyder的风格修改,喜欢spyder风格的朋友们可以在Rstudio使用这款主题,使用方法可以参考我的文章
检查未交作业小工具,可以根据学生名单表格,和学生交来的文件作业,检查出哪些同学没有交作业,并打包成界面小工具,便于可视化操作
检查未交作业小工具,可以根据学生名单表格,和学生交来的文件作业,检查出哪些同学没有交作业,并打包成界面小工具,便于可视化操作,部分代码展示如下:
#检查交作业小工具打包
import tkinter
from tkinter import *
from tkinter import filedialog, dialog
from tkinter.filedialog import askdirectory
import os #用于路径读取
import glob#用于读取文件路径
import pandas as pd
root = Tk()
root.geometry('740x500+200+100') # 窗口尺寸
root.title("小工具")
#-------------------------------------------------------
#选择输入文件路径
用python编写的QDA模型
用python编写的QDA模型,部分代码如下:
In [1]: from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis as QDA
In [2]: from sklearn.metrics import accuracy_score,confusion_matrix
In [3]: import pandas as pd
In [4]: data = pd.read_csv('Smarket.csv',index_col=0)
In [5]: data.shape #数据维度
Out[5]: (1250, 9)
In [6]: predictors = ['Lag1','Lag2']
In [7]: train = data[data['Year']<2005] #训练集
In [8]: test = data[data['Year'] == 2005] #测试集
In [9]: X_train = train[predictors] #训练集中的观测
In [10]: X_test =
用mysql编写的vintage分析代码
用mysql编写的vintage分析代码
用python编写的文本聚类代码
用python编写的文本聚类代码,部分代码如下:
import re
# 去除文本中的表情字符(只保留中英文和数字)
def clear_character(sentence):
pattern = re.compile('[^\u4e00-\u9fa5^a-z^A-Z^0-9]')
line = re.sub(pattern, '', sentence)
new_sentence = ''.join(line.split())
return new_sentence
train_text = [clear_character(data) for data in df["data"]]
train_text[:1]
#分词的过程较为缓慢,请耐心等待
import jieba
train_seg_text = [jieba.lcut(s) for s in train_text]
train_seg_text[:1]
用mysql编写的窗口函数的使用案例
用mysql编写的窗口函数的使用案例
使用python编写的爬取疫情数据的代码
使用python编写的爬取疫情数据的代码,主要使用的是selenium模块
采用python编写的使用机器学习方法对旅游文本数据进行分析
采用python编写的使用机器学习方法对旅游文本数据进行分析,部分代码如下:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import svm
import jieba
from sklearn.model_selection import train_test_split
from sklearn.model_selection import StratifiedKFold
from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizer
from sklearn.model_selection import GridSearchCV
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import cross_val_score
from sklearn.decomposition import PCA
from s
使用python编写的基于逻辑回归的文本分类
使用python编写的基于逻辑回归的文本分类,部分代码如下:
#基于逻辑回归的文本分类
import sklearn
from sklearn import linear_model
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import TfidfVectorizer
from nltk.corpus import movie_reviews #载入电影评论数据
import random
import nltk
#----------------------------------------------------
def getData():
files=movie_reviews.fileids()
categories=movie_reviews.categories()
documents=[]
for c in categorie
使用python编写的统计学LDA模型实战案例
使用python编写的统计学LDA模型实战案例,
In [3]: import pandas as pd
In [4]: data = pd.read_csv('Smarket.csv',index_col=0)
In [5]: data.shape #数据维度
Out[5]: (1250, 9)
In [6]: predictors = ['Lag1','Lag2']
In [7]: train = data[data['Year']<2005] #训练集
In [8]: test = data[data['Year'] == 2005] #测试集
In [9]: X_train = train[predictors] #训练集中的观测
In [10]: X_test = test[predictors] #测试集中的观测
In [11]: y_train = train['Direction'] #训练集中的响应值
In [12]: y_test = test['Direction'] #测试集中的响应值
In [13]: #载入LDA模块
使用java编写16进制颜色值转换为RGB颜色值
使用java编写16进制颜色值转换为RGB颜色值
用java编写颜色rgb转16进制
在这个代码中,我们定义了一个RGBtoHex类,其中包含了一个静态方法rgbToHex用于将RGB颜色值转换为16进制表示。在main方法中,我们定义了RGB颜色值的整数变量red、green和blue,然后调用rgbToHex方法将其转换为16进制表示,并输出结果。
使用python做拟合优度检验
卡方检验(chi-squared test)通常用于比较观测值和期望值之间的偏差程度。在拟合优度检验中,卡方检验可以用来评估观测数据与理论模型之间的拟合程度。具体来说,它可以用来检验观测频数与期望频数之间的差异是否显著。代码中使用了scipy.stats库中的函数进行卡方检验
使用pyecharts绘制直方图
使用pyecharts绘制直方图
python编写颜色代码十六进制转rgb
python编写颜色代码十六进制转rgb
使用python把颜色代码rgb转十六进制
使用python把颜色代码rgb转十六进制
使用python绘制雷达图
使用python绘制雷达图
部分代码展示
import numpy as np
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams["font.sans-serif"] = ["KaiTi"] # 指定默认字体
plt.rcParams["axes.unicode_minus"] = False # 解决保存图像是负号"-"显示为方块的问题
plt.style.use("ggplot") # 设置ggplot样式
# 原始数据集并获取数据集长度
results = [{"准确率": 0.91, "精确率": 0.82, "召回率": 0.66, "F1": 0.73 ,'AUC':0.8710},
{"准确率": 0.91, "精确率": 0.84, "召回率": 0.66, "F1": 0.74 ,'AUC':0.8799},
{"准确率": 0.89, "精确率": 0.82, "召回率": 0.61, "F1": 0.70 ,'AUC':0.7381},
pycharts绘制世界地图代码
使用python中的pycharts模块绘制世界地图代码
由F值和自由度计算P值
输入F值和自由度1、自由度2的值,点击计算P值就可以得到P值结果
25行代码爬取数据(新冠肺炎数据)
使用selenium爬取数据并写入excel,代码简洁明了,需要先下载好电脑浏览器驱动,注意驱动版本要对应浏览器,下载好之后放在一个文件夹里,本代码可以模拟浏览器,避免反爬虫
也有利于学习爬虫代码,部分代码展示如下:
#python爬取数据
from selenium import webdriver
import pandas as pd
driverPath="D:\driver\msedgedriver.exe"
browser=webdriver.Edge(driverPath)
#输入网址
ur3 = 'https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_banner'
原创词云图制作小工具代码
该款小工具使用python创作,可以自主选择文本文件(txt格式),停用词文本(txt格式),用户词典(txt格式),并且可以自主选择词云图形状或图片(jpg或png格式),并且有可视化页面(成品见图),也适合初学者学习GUI设计,以下是部分代码展示
import tkinter
from tkinter import *
import os #用于路径读取
import glob#用于读取文件路径
import jieba
import jieba.analyse
import wordcloud
import skimage
import skimage.io
Label(root, text="txt文本",bg="#00aaff").grid(row=2, column=1)
Entry(root, textvariable=inpath0,state="readonly",width=15).grid(row=2, column=2,ipadx=150)#ipadx是条形框长度
Button(root, text="输入路径选择", width=15,height=1,co
自己总结的R语言数据分析笔记
自己总结的R语言笔记,适合初学者使用,以下是部分展示
利用 ggplot2 绘折线图
前面我们说过 ggplot2 放置散点图是 ggplot() + geom_point()格式,替换折线
图,我们只需要再加上 geom_line()。在这里说明一下 geom_xxx()中的参数:
•alpha:,0-1
•颜色:颜色,名称或 RGB 编码
•fill:填充色
•shape:形状,同 pch
•尺寸:大小
data = read.table('line-4.txt', sep="\t", header=T)
head(data)
library(ggplot2)
pd = position_dodge(0.3)
ggplot(data, aes(Date, Weight, colour=Cultivar, group=Cultivar))+
geom_line(size=1, position=pd) +
geom_point(size=3, position=pd)
自己总结的python笔记
自己总结的python笔记,适合初学者使用,排版简洁美观适合直接打印,以下是部分展示,
批量读取文件
In [6]: import pandas as pd #载入 pandas 包记为 pd
In [7]: import os #载入 os 包
In [8]: import glob #载入 glob 包
In [9]: a= glob.glob('*.csv') #获取工作目录下的文件列表,*.csv 为文件格式
In [10]: data0=pd.read_csv(a[0],engine="python",encoding="gbk")
#读取第 1 个文件
In [12]: for i in range(1,3,1):
...: data=pd.read_csv(a[i],engine="python",encoding="gbk")
...: data0=pd.concat([data0,data],axis=1)
...: #把每次读取的文件与上一个合并,axis=1 是按列合并,0 是按行合并
In [13]: data0.to_excel("data11.xlsx"
python批量提取pdf表格与文字
python批量提取pdf表格与文字,要求pdf格式不能是图片转的,也不能是加密的,就可以使用这个代码提取