BrainEditor
码龄6年
关注
提问 私信
  • 博客:13,197
    问答:1,494
    14,691
    总访问量
  • 14
    原创
  • 1,872,886
    排名
  • 13
    粉丝
  • 0
    铁粉

个人简介:BrainEditor,a brain editor by profession, is actually a text-miner

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2019-08-11
博客简介:

weixin_45514087的博客

查看详细资料
  • 原力等级
    当前等级
    0
    当前总分
    19
    当月
    0
个人成就
  • 获得22次点赞
  • 内容获得0次评论
  • 获得61次收藏
创作历程
  • 2篇
    2024年
  • 18篇
    2020年
成就勋章
兴趣领域 设置
  • 人工智能
    tensorflow
创作活动更多

开源数据库 KWDB 社区征文大赛,赢取千元创作基金!

提交参赛作品,有机会冲刺至高2000元的创作基金,快来参与吧!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hugging*face follow up

发布问题 2024.05.20 ·
0 回答

hugging-face 模型无法安装

发布问题 2024.05.13 ·
2 回答

复制运行了 kaggle 上的ted talk 项目 除了最后的那及部分 其他已经通关

发布资源 2024.05.01 ·
ipynb

ValueError: invalid literal for int() with base 10: ‘2021-04-05T00:00:00.000+00:00‘

经过haggle with gpt 3.5 一番之后,它终于能给出了正确的代码,如下。将如标题中的时间提取出来是,书上给的代码是。
原创
发布博客 2024.04.29 ·
162 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

UnboundLocalError: cannot access local variable 就没有一个专家能解决这个问题吗?

答:

chatGpt 的回答也很有意思,也先说代码错了,然后提出了修改后的代码,但是当我指出修改后的代码段和之前的一模一样时,它马上道歉说,代码没错,可能是由于其他原因引起的

回答问题 2024.04.29

UnboundLocalError: cannot access local variable 就没有一个专家能解决这个问题吗?

发布问题 2024.04.29 ·
6 回答

UnboundLocalError: cannot access local variable

答:

问题还没有解决。

回答问题 2024.04.25

UnboundLocalError: cannot access local variable

发布问题 2024.04.21 ·
6 回答

git bash 的make 又在搞事情

答:

thanks for trying.

回答问题 2024.04.18

python 代码运行 NameError

答:

之前的部分代码如下。可以输出stopwords,

from sklearn.dummy import DummyClassifier
from sklearn import preprocessing
from nltk.stem.snowball import SnowballStemmer
from Chapter01.tokenization import tokenize_nltk

stemmer = SnowballStemmer('english')
bbc_dataset = "Chapter04/bbc-text.csv"
stopwords_file_path = "Chapter01/stopwords.csv"
stopwords = []

def read_in_csv(csv_file):
    with open(csv_file, 'r', encoding='utf-8') as fp:
        reader = csv.reader(fp, delimiter=',', quotechar='"')
        data_read = [row for row in reader]
    return data_read

def tokenize_and_stem(sentence):
    tokens = nltk.word_tokenize(sentence)
    filtered_tokens = [t for t in tokens if t not in string.punctuation]
    stems = [stemmer.stem(t) for t in filtered_tokens]
    return stems

def get_stopwords(path=stopwords_file_path):
    stopwords = read_in_csv(path)
    stopwords = [word[0] for word in stopwords]
    stemmed_stopwords = [stemmer.stem(word) for word in stopwords]
    stopwords = stopwords + stemmed_stopwords
    return stopwords

stopwords = get_stopwords(stopwords_file_path)

def get_data(filename):
    data = read_in_csv(filename)
    data_dict = {}
    for row in data[1:]:
        category = row[0]
        text = row[1]
        if (category not in data_dict.keys()):
            data_dict[category] = []
        data_dict[category].append(text)
    return data_dict 

```

”

回答问题 2024.04.18

python 代码运行 NameError

发布问题 2024.04.18 ·
4 回答

git bash 的make 又在搞事情

发布问题 2024.04.12 ·
5 回答

复制粘贴学NLP

文科生学NLP
原创
发布博客 2024.04.07 ·
715 阅读 ·
19 点赞 ·
0 评论 ·
19 收藏

文本清理代码快速查找(copy and paste series)

文本清理代码快速查找(copy and paste series)去掉标点text = re.sub("[\s+.!/_,$%^(+"’]+|[+——!,。?、~@#¥%……&()]+",“”,text)新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会...
原创
发布博客 2020.02.10 ·
429 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

网页爬虫权威指南 (chap1-2)(web scraping with python, 2e. by Ryan Mitchell)

Chapter 1 Begining to Scrapefrom urllib.request import urlopenhtml = urlopen(‘http://www.chinadaily.com.cn/a/202002/07/WS5e3c81dea310128217275978**.html’**)print(html.read())from urllib.request im...
原创
发布博客 2020.02.07 ·
454 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

中文情感分析数据

情感分析资源大全(语料、词典、词嵌入、代码) 原创 ...
转载
发布博客 2020.02.06 ·
5109 阅读 ·
0 点赞 ·
0 评论 ·
28 收藏

中文数据集

中文NLP语料整理新闻文本...
转载
发布博客 2020.02.06 ·
1508 阅读 ·
1 点赞 ·
1 评论 ·
10 收藏

博客搬家

准备达里搬运各大网站的博客到此处。颤抖吧!
原创
发布博客 2020.02.06 ·
101 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

史上最全数据集网站汇总

如果你是一个初学者,你每完成一个新项目后自身能力都会有极大的提高,如果你是一个有经验的数据科学专家,你已经知道这里所蕴含的价值。 本文将为您提供一个网站/资源列表,从中你可以使用数据来完成你自己的数据项目,甚至创造你自己的产品。一.如何使用这些资源?如何使用这些数据源是没有限制的,应用和使用只受...
转载
发布博客 2020.02.06 ·
993 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

(转发)免费数据集下载(持续更新中...)

刚刚知道这个网站,记录下·https://blog.csdn.net/alec1987/article/details/69388699自然语言处理RCV1英语新闻数据20news 英语新闻数据First Quora Release Question Pairs 问答数据JRC Names各国语言专有实体名称Multi-Domain Sentiment V2.0LETOR 信息检索...
原创
发布博客 2020.02.06 ·
563 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多