从本质上讲,人工智能的目标就是最优化——在复杂环境中与多体交互中做出最优决策
几乎所有的人工智能问题都会归结为一个优化问题
- 在线性搜索中,确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数
- 置信域的思想是先确定搜索步长,再确定搜索方向
从本质上讲,人工智能的目标就是最优化——在复杂环境中与多体交互中做出最优决策
几乎所有的人工智能问题都会归结为一个优化问题
矩阵上的运算:特根特向求法,张量积,广义逆
随着联结主义学派的兴起,概率统计已经取代了数理逻辑,成为了人工智能研究的主流工具
数理统计的关注点是 无处不在的可能性
频率学派认为先验分布式固定的,模型参数靠最大似然估计计算
贝叶斯学派认为先验分布是随机的,模型参数靠后验概率最大化计算
数理统计的任务是根据可观察的样本反过来推断总体的性质
推断的工具是统计量,统计量是样本的函数,是个随机变量
参数估计通过随机抽取的样本来估计总体分布的未知参数,包括点估计和区间估计
假设检验通过随机抽取的样本来接收或拒绝关于总体的某个判断
矩阵函数
参考:
kenjihiranabe——The-Art-of-Linear-Algebra-zh-CN
详细计算方法与理论:见矩阵论
线性代数的本质在于将具体事物抽象为数学对象,并描述其静态和动态特性
最基本的概念是 set
集合的定义是由某些具有某些共性的对象汇总成的集体。
将这些对象用数字或符号表示(对象映射到数域),这样集合中的元素就变为了多个数字或符号以某种方式排列成的组合
矩阵分解可以得到简化的乘积矩阵,可以简化后续的计算与处理度
矩阵论准备知识,很多内容都是线性代数的扩展
离线RL是DRL的子领域,不需要与与环境在线交互,可以直接从数据中学习策略完成相关任务。