AI 技术的核心本质是什么
有一本科普书籍专门讲AI技术背后的原理,书名《Why Machines Learn: The Elegant Math Behind Modern AI》,中文一般翻译为《人工智能背后的数学原理》,这本书不讲AI具体的算法,也不讲实现AI的代码,是一本纯叙述的AI科普书籍,非常适合非AI行业,但对AI感兴趣的人阅读。

本书作者Anil Ananthaswamy是一名专职科普作家,擅长将复杂科学用大众语言呈现给读者。书中将机器学习背后的数学知识做了详尽的阐述,读者最好对线性代数、概率等基础数学知识有一定的了解。
这本书可以帮助理解AI为何能够自动输出内容:
- 1、线性代数:将海量数据表示为向量,定义模型的表达空间。
- 2、微积分:优化模型。
- 3、概率:让模型做出决策(输出内容)。
说得更简洁一点,就是通过训练已知数据,在表达空间中确定了一个参数规模极大(万亿)的函数,这个函数被称做模型,最后将这个模型供用户使用,用户向AI询问,相当于函数的输入,AI回答问题,相当于函数的输出。当然这个函数与一般的函数不同,它由数据堆叠为高维空间,人类只能对它进行调优,不能像普通函数那样想怎么改就怎么改。
为什么上面要说“确定了一个函数”,而不能说“生成了一个函数”,难道这个函数原本就存在,只是正好被人类发现了吗?不过机器学习的拟合过程看起来确实很像是在寻找最优的那个函数,好像是当数据准备好的时候,这个函数就存在了。
本书还对Transformer架构做了简单的介绍,这是目前主流模型的通用架构,但是仍然有许多弊端,相信未来一定会有计算复杂度较低的架构模式。
书籍下载地址:Why Machines Learn: The Elegant Math Behind Modern AI