去年,在全球范围尤其是在国内人工智能火过了头。大家不由自主地都开始谈论人工智能并担忧它可能带来的后果。
但是人工智能现在只能叫人工智障,并没有大家想象的那么厉害。另外,机器的智能程度完全取决于人教机器的程度。去年入行时听到最贴切的一句话是:人工智能是人工智能。至少在工业界,确实如此。
拿聊天机器人来说,分为两种,一种是用于日常聊天、娱乐的机器人,比如微软小冰、以前的小黄鸡,它们原理是抓取大量网络聊天对话,构建大量寒暄性质的聊天场景的模型并进行训练和优化,在实际人机交互过程中,遇到类似的场景,机器人就知道怎么回答(这个知道,并不是我们理解的知道,而是能够返回应答内容,机器一定是不知道为什么如此回答的,因为机器没有类似人类的思维能力)。这种机器人好处在于,只要喂了大量的语料,它就能聊,但问题是回答内容不能当真,或者说只是娱乐性的,它答错了也无伤大雅,有时候还能博人一笑。之前出现的小冰骂人事件就是这个原因,可以理解为聊天机器人是无人监管状态的,语料里有骂人的话,“教”给了机器人,机器人也就会骂人了。如果你问为什么没有人工干预?我们日常聊天的内容太宽泛,没有边界,几乎可能涉及到所有人类知识和经验,如果机器人想要什么都能回答的了,只能喂它海量数据,然而人工是不可能把这些数据全部核对一遍的,工作量和成本都巨大,因此只能针对某些问题进行过滤,比如找出并处理掉骂人的语句,来解决这个问题。
那么与这种通用的聊天机器人相比,第二种机器人就是服务于专业领域的、回答准确性要求相对了高了很多的客服型或助手型机器人,比如微软小娜,市面上的客服机器人等。这些机器人主要是回答某一领域原来由客服人员解答的大量重复性问题,这些问题比聊天内容专业,但又不会太复杂,在需要时可以很快给我们反馈。这种机器人的原理,目前工业界的做法主要是靠人工干预,深度学习提取特征自我训练没办法商用,因为商用的场景几乎要求百分百准确,机器人一旦回答错误给用户造成损失,那企业就要承担责任,企业冒不起这个风险。因此,现阶段,商用客服类机器人几乎都是人工整理机器人的知识,再通过机器学习的方法调教机器人,让机器人的回复率和准确率可以满足企业客服系统的要求。
其他的人工智能系统(比如硬件机器人,需要集成应答系统软件)想要拥有类似的回答问题的能力都需要这么做。
说了这么多是想表达一个观点,现在的人工智能在自然语言问答这方面还很智障,完全没有思维能力,我个人估计也不会拥有。