“价值2个亿”的AI代码

最新推荐文章于 2024-07-15 09:43:14 发布

Crossin的编程教室

最新推荐文章于 2024-07-15 09:43:14 发布

阅读量4.3k

点赞数 2

分类专栏：编程笔记文章标签： python

本文链接：https://blog.csdn.net/qq_40523737/article/details/85098510

版权

编程笔记专栏收录该内容

77 篇文章 8 订阅

订阅专栏

前两天朋友圈里看到一段号称“价值一亿”的代码：

可以智能应答，很厉害是不是？

源码：

Python 极简版：

while True:
    print(input('').replace('吗','').replace('？','！'))

其实就是几个字符替换！抖了个机灵，也顺便黑了把当下某些言必称 AI 的风气。你别说，当年区块链概念火爆的时候，还真有人代码里放了个“Hello World”就出来诓钱了。风口之下，什么样的妖魔鬼怪都有。

不过真要自己做一个自动应答的机器人，其实也很简单，而且功能还比上面这位更强大。

方法一：ChatterBot 模块

ChatterBot 是一个生成自动应答的第三方库。一个简单的例子：

from chatterbot import ChatBot
# 生成机器人，指定输入输出和训练器
chatbot = ChatBot(
    'CrossinBot',
    input_adapter='chatterbot.input.TerminalAdapter',
    output_adapter='chatterbot.output.TerminalAdapter',
    trainer='chatterbot.trainers.ChatterBotCorpusTrainer'
)
# 以中文语料进行训练
chatbot.train('chatterbot.corpus.chinese')
print('你好，请问需要什么帮助？')
# 循环问答
while True:
    try:
        bot_input = chatbot.get_response(None)
    except (KeyboardInterrupt, EOFError, SystemExit):
        # CTRL-C/CTRL-D 中断退出
        break

效果：

使用 ChatterBot 的好处是问答数据保存在本地，无需联网。缺点则是你需要自己去训练你的机器人，默认语料的效果其实挺差的，一开始聊天差不多就是人工智障……而且通过聊天的过程学习，也存在被用户“教坏”的问题。
官方文档地址：
chatterbot.readthedocs.io

方法二：开放 AI 接口

鉴于方法一的问题，有很多平台提供了智能应答的 API 接口服务。以腾讯 AI 开放平台的“智能闲聊”接口为例：

import requests as rq
import time
import random
import string
import urllib
import hashlib

APPKEY = 'ABDEFGH'  # 换成你的APPKEY

def get_sign(data):
    lst = [i[0] '=' urllib.parse.quote_plus(str(i[1])) for i in data.items()]
    params = '&'.join(sorted(lst))
    s = params   '&app_key='   APPKEY
    h = hashlib.md5(s.encode('utf8'))
    return h.hexdigest().upper()

def chat(question):    
    url_chat = 'https://api.ai.qq.com/fcgi-bin/nlp/nlp_textchat'
    nonce_str = ''.join(random.sample(string.ascii_letters   string.digits, 16))
    data = {
        'app_id': 1234567890,  # 换成你的app_id
        'time_stamp': int(time.time()),
        'nonce_str': nonce_str,
        'session': '10000',
        'question': question,
    }
    data['sign'] = get_sign(data)
    r = rq.post(url_chat, data=data)
    answer = r.json()['data']['answer']
    return answer

print('你好，请问需要什么帮助？')
while True:
    try:
        print(chat(input()))
    except (KeyboardInterrupt, EOFError, SystemExit):
        # CTRL-C/CTRL-D 中断退出
        break

效果：

这个效果显而易见。但接口的前提是要联网，另外平台通常会有请求频率或功能的限制。现在很多平台还都可免费申请使用，部分特性可能需要付费。开放平台的好处是开发者可以不用费事就能得到很好的结果，不过要深度定制就不太方便，另外核心技术和数据也都是平台方的。

如果说前面那段代码可以估值一亿，拿个天使轮投资。那我这两段代码怎么也得值2个亿吧，可以直接A轮了。记得到时把咨询费打赏给我

玩笑归玩笑，但以上三段代码，也的确代表了三种开发方式：

自己实现
用第三方框架/库/代码
用 API 接口服务

在实际开发中，尤其是非核心功能，通常不建议自己从头实现，即“不重复造轮子”。因为很可能已经有成熟的开源项目做得比你好，站在前人的肩膀上可以事半功倍。这也是软件/互联网行业得以蓬勃发展的基石。但在使用开源项目和代码时也要尊重知识产权，注意人家的协议，是否可以商用，很多接口和数据也是有限制的。并不是你能拿到代码、能扒出接口、爬到数据，就可以放到自己的产品中。这方面有不少规矩，不按规矩来，即侵犯了别人的利益，也可能让自己掉坑里。下次可以来细说一下。

════

其他文章及回答：