经过半个多世纪的发展,今天的计算机能以惊人的速度计算。计算机虽然算得快,但需要人类给出极为具体的指令,比如“比较两个数的大小”或者“给一个数加上一”。无论多么复杂的程序,都是由这些简单的运算堆积而来。这些简单的运算组合起来,可以完成很多惊人的任务,我们用这种办法建造了复杂的网站,模拟各种自然现象,让我们可以在手机上看视频,还能处理各种各样的办公软件。
然而,无论怎么组合,简单的运算却无法产生复杂的智能。因为人的认知能力是从上而下产生的。我们大脑可以通过仍然不太清楚的机制,迅速“捕捉”到语言或图片的高层特征和含义。与人不同的是,计算机采用的是自下而上的方式运行,必须从最底层的基本规则开始定义。但很多对人类来说很简单的工作,却很难提出非常具体的规则。
我们承认某些问题的复杂性,所以根本不尝试从内部破解它,而是把它当成一个黑盒子,可以根据不同的输入做出合理的输出。过去几十年,机器学习和统计学习领域的学者陆续提出了很多不同的模型。之后,为了适应不同的场景,模型的结构也在不断进化。那些让我们惊叹的对话能力,的确是通过一个几千亿参数的模型,在人类的语言上完成的自我学习。
市科协供稿