AmosTian

0%

TD算法

发表于 2024-05-10 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 2.8k字 | 阅读时长 ≈ 10 分钟

[TOC]

阅读全文 »

有模型强化学习

发表于 2024-05-10 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 5字 | 阅读时长 ≈ 1 分钟

规划和学习

DP算法

发表于 2024-05-06 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 5.1k字 | 阅读时长 ≈ 14 分钟

[TOC]

阅读全文 »

ceph quincy 版本部署

发表于 2024-05-05 更新于 2026-01-18 分类于存储 > 分布式存储 > Ceph

本文字数 6.5k字 | 阅读时长 ≈ 24 分钟

[TOC]

阅读全文 »

gym

发表于 2024-05-05 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 0字 | 阅读时长 ≈ 1 分钟

多臂老虎机

发表于 2024-05-05 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 3.9k字 | 阅读时长 ≈ 9 分钟

[TOC]

阅读全文 »

多臂老虎机

发表于 2024-05-05 更新于 2024-10-04 分类于 AI > 机器学习 > 强化学习

本文字数 2.8k字 | 阅读时长 ≈ 7 分钟

[TOC]

阅读全文 »

注意力机制

发表于 2024-04-27 更新于 2024-10-04 分类于 AI > 机器学习 > 深度学习

本文字数 2.4k字 | 阅读时长 ≈ 6 分钟

[TOC]

阅读全文 »

Linux常用

发表于 2024-04-19 更新于 2025-12-07 分类于环境与工具 > Linux

本文字数 1.2k字 | 阅读时长 ≈ 2 分钟

[TOC]

阅读全文 »

10. Transformer 原理

发表于 2024-04-17 更新于 2024-10-04 分类于 AI > 机器学习 > 深度学习

本文字数 13k字 | 阅读时长 ≈ 20 分钟

本文翻译自 Ketan Doshi 博客中关于 Transformers Explained Visually 的系列文章
Overview of Functionality ：Components of the architecture, and behavior during Training and Inference
How it works, step-by-step ：How data flows and what computations are performed, including matrix representations
Multi-head Attention ：Inner workings of the Attention module throughout the Transformer
Why Attention Boosts Performance：How does Attention capture the relationships between words in a sentence
http://fancyerii.github.io/2019/03/09/transformer-illustrated/

[TOC]

阅读全文 »