人工智能导论 极速版

zstu 浙江理工大学 2023学年第1学期 人工智能 开卷考试 期末复习

介绍

智力是学习、理解或处理新情况或困难情况的能力;
应用知识来操纵环境或抽象思考的能力

image-20231225234617578

image-20231225234637339

知识表示

命题逻辑

理论

命题是一个陈述句,并且必须能判断真假

image-20231225235102921

image-20231225235151513

image-20231225235331160

image-20231225235354291

扫描件_等值式_1

题目

image-20231225235503519

image-20231225235514757

image-20231225235539004

image-20231225235635468

image-20231225235640865

image-20231225235656649

image-20231226000723498

谓词逻辑

理论

谓词描述关系

P(x) 或 M(x) 表示一个一元谓词逻辑

image-20231225235825351

扫描件_定义2_3量词是描述个体常项与个体变项之_1

扫描件_第2章一阶逻辑_1

量词不能随意调换顺序

量词的优先级比逻辑联结词高

扫描件_定理2-2否定等值式_1

扫描件_定理24量词分配律_1

扫描件_一个谓词公式可以演算成与之等值的标准形式_1

前束范式运算前先换名

image-20231226000606035

题目

image-20231226000112663

image-20231226000120865

image-20231226000131343

image-20231226000501607

image-20231226000527687

image-20231226000547183

image-20231226000741956

产生式系统

image-20231226000812764

image-20231226000818722

image-20231226000826856

image-20231226000838242

image-20231226000859149

框架系统

image-20231226000924456

image-20231226000933405

image-20231226000939683

image-20231226000946606

image-20231226000957744

状态空间系统

image-20231226001023321

image-20231226001036378

image-20231226001044195

知识图谱*

image-20231226001135978

image-20231226001147128

image-20231226001153868

image-20231226001200587

image-20231226001207587

image-20231226001215010

搜索

理论

image-20231226001241015

image-20231226001335013

image-20231226001349174

image-20231226001403400

image-20231226001410395

image-20231226001434338

image-20231226001443568

image-20231226001531516

题目

image-20231226001457876

image-20231226001507819

模型评估和选择

准确率 误差 过拟合

image-20231226001623609

image-20231226001657563

image-20231226001705605

image-20231226001727422

image-20231226001738210

评估方法

image-20231226001941537

image-20231226001952193

image-20231226002007852

image-20231226002022812

性能指标

image-20231226002123085

image-20231226002130184

image-20231226002143936

image-20231226002152418

image-20231226002207073

image-20231226002217110

image-20231226002224463

题目

image-20231226002258774

image-20231226002311319

image-20231226002330301

image-20231226002403831

机器学习

监督学习

回归

image-20231226002538556

线性回归

image-20231226002546750

image-20231226002623421

image-20231226002639972

逻辑回归

image-20231226002702076

image-20231226002755611

分类

image-20231226002821957

最近邻

image-20231226002915035

image-20231226002929121

ϵ-ball 最近邻

image-20231226003016883

K 近邻

image-20231226003032811

确定 k 近邻算法(k-NN)中 k 值的大小是一个重要决策,因为它直接影响到算法的性能。没有固定的规则来选择最佳的 k 值,但是可以通过以下方法来确定:

  1. 交叉验证:最常用的方法是通过交叉验证,特别是 k 折交叉验证。在这种方法中,数据集被分成 k 个小组(folds)。算法在 k-1 个小组上训练,并在剩下的一组上测试。这个过程重复进行,每次选择不同的组作为测试集,然后取平均误差率。通过比较不同 k 值的误差率,可以选择最佳的 k 值。

  2. 误差率:对于分类问题,可以计算不同 k 值对应的误差率。误差率最低的 k 值通常会被选择。对于回归问题,可以计算均方误差(MSE)。

  3. 启发式方法:通常,k 值的选择应该是一个奇数(如果类别数为偶数),以避免决策的平局。一个常见的启发式方法是选择 (\sqrt{n}),其中 n 是训练样本的数量。

  4. 距离权重:考虑距离权重可以减少更远邻居的影响,这样可以在考虑更多的邻居(较大的 k 值)的同时减少噪声数据的影响。

  5. 问题特定知识:有时,对问题的了解可以帮助确定 k 的值。例如,在高度不平衡的数据集中,较大的 k 值可能有助于防止算法过分偏向多数类。

  6. 模型复杂度:较小的 k 值会导致模型复杂度高,可能过拟合数据;较大的 k 值会导致模型简单,可能无法捕捉数据结构。因此,需要找到一个平衡点。

  7. 可视化工具:有时候,将不同的 k 值的效果可视化,例如通过绘制误差率和 k 值的关系图,可以帮助选择一个好的 k 值。

  8. 规则化方法:当数据集非常大时,可以使用规则化方法来选择 k。例如,可以将 k 设置为训练样本数量的一个小百分比。

距离

image-20231226003831748

最近子空间分类器*

image-20231226003846351

image-20231226003910874

image-20231226003919381

非监督学习

K-均值聚类

image-20231226093237982

image-20231226093326117

image-20231226093356816

image-20231226093406866

image-20231226093416072

image-20231226093425875

image-20231226093438871

image-20231226093447604

image-20231226093504110

image-20231226093608889

image-20231226093621440

谱聚类*

image-20231226093725010

image-20231226093734827

image-20231226093748777

题目

image-20231226093521977

image-20231226093527701

image-20231226093534540

image-20231226093540608

image-20231226093547420

表示学习-线性编码*

image-20231226094006456

image-20231226094047128

表示学习-PCA*

image-20231226094141936

image-20231226094150296

表示学习应用:人脸图像压缩 图像去模糊 图像去噪 形态成分分析 图像修复

强化学习

image-20231226094741449

image-20231226094827747

image-20231226094841544

image-20231226094856752

Q-Learning

image-20231226094941750

image-20231226095002202

image-20231226095012577

image-20231226095028712

image-20231226100016133

image-20231226100027876

image-20231226100059748

神经网络

历史

image-20231226100133188

神经元

image-20231226100201642

激活函数

image-20231226100219893

image-20231226100230596

image-20231226100238240

image-20231226100302971

题目

image-20231226100345367

前馈神经网络 FNN

image-20231226100518069

image-20231226100609092

循环神经网络 RNN

image-20231226100701697

image-20231226100711886

image-20231226100721630

image-20231226100735285

image-20231226100840101

题目

image-20231226101427932

损失函数

image-20231226100924698

image-20231226100933684

image-20231226100941780

最速下降法

image-20231226101047508

image-20231226101056401

深度学习

image-20231226101112828

image-20231226101126707

反向传播

image-20231226101145588

image-20231226101153653

image-20231226101201752

image-20231226101209217

image-20231226101216893

image-20231226101223638

image-20231226101233192

卷积神经网络

历史

image-20231226101313011

感受野

image-20231226101518314

特征图

image-20231226101648433

卷积

image-20231226101703524

image-20231226101758482

题目

image-20231226101728230

image-20231226101737357

image-20231226101824971

池化

image-20231226101853645

题目

image-20231226101908468

成就和应用

image-20231226102025438

image-20231226102032190

image-20231226102038536

image-20231226102044606

image-20231226102052312

题目

image-20231226102113742

image-20231226102120925

序列学习*

序列学习(Sequence Learning)是机器学习中的一个重要分支,专注于从序列数据中学习模式和结构。序列数据是指数据元素按特定顺序排列的数据,例如时间序列数据、文本、语音或者视频帧。序列学习的目标是理解这些数据的内在结构,并能够预测或生成新的序列。

主要类型

  1. 时间序列预测:用于预测未来的数据点,例如股票价格预测、天气预报等。

  2. 序列生成:生成与训练数据类似的新序列,如文本生成、音乐创作等。

  3. 序列分类:将序列数据分类到不同类别中,例如语音识别或情感分析。

  4. 序列标注:在序列的每个元素上进行分类,常用于诸如命名实体识别、词性标注等任务。

关键技术

  1. 递归神经网络(RNN):一种特别适用于序列数据的神经网络结构,能够处理任意长度的序列。

  2. 长短期记忆网络(LSTM):RNN的一种变体,通过特殊的结构解决了RNN长期依赖问题。

  3. 门控循环单元(GRU):与LSTM类似,但结构更简单,效果也很好。

  4. Transformer:一种基于自注意力机制的模型,特别适用于大规模序列数据处理,如机器翻译。

  5. 卷积神经网络(CNN):虽主要用于图像处理,但也可用于处理序列数据,特别是在处理较短的序列时。

应用场景

  • 自然语言处理:如机器翻译、文本摘要、情感分析等。
  • 语音识别:将语音信号转换成文字。
  • 视频分析:从视频序列中识别特定事件或对象。
  • 股票市场分析:预测股票价格变化。
  • 生物信息学:如蛋白质结构预测。

挑战

  • 长期依赖问题:在处理长序列时,传统模型(如RNN)难以记住早期信息。
  • 资源消耗:特别是对于大规模模型(如Transformer),需要大量的计算资源。
  • 数据质量和可用性:高质量、标注良好的序列数据并不总是可用。

序列学习是一个快速发展的领域,随着新技术的出现,其应用范围和效果都在不断提升。