深度学习简介

约 984 字大约 3 分钟

2026-03-31

这节课解决什么问题

Machine Learning 说明了“模型如何学习”。这一节要回答的是：为什么 Deep Learning 能成为这一轮 AI 爆发的核心方法，以及它和今天的大模型到底是什么关系。

Deep Learning 是建立在多层神经网络上的学习方法。
“深”不是抽象概念，而是网络层数更多、表达能力更强，能够自动从复杂数据里提取更高层次的特征。

和早期大量依赖人工设计特征的方法相比，Deep Learning 更擅长直接处理：

神经网络本质上是在做一连串可学习的变换。

你可以把它想成多层过滤器：

在图像里，浅层可能识别边缘和纹理；在文本里，浅层可能识别词与词的关系，深层则开始理解上下文和语义。

Deep Learning 的能力不是只靠“方法更新”来的，而是三件事共同推动：

当这三件事叠加后，模型不再只适合做单点任务，而开始表现出更强的通用能力。

今天常说的大模型，本质上仍然属于 Deep Learning 的范畴。它们不是完全不同的物种，而是神经网络路线在数据、参数和训练方式上大幅扩展后的结果。

你可以把关系理解成：

当前文本与多模态大模型大多建立在 Transformer 架构上。它的重要性在于：

你不需要现在就掌握内部公式，但需要知道：
今天绝大多数 AI × Web3 场景里用到的语言模型、代码模型和多模态模型，背后都离不开这条技术路线。

Deep Learning 适合做的事情包括：

但它不适合被神化。
在链上场景里，模型再强，也仍然需要：

学完后，至少要能说清楚：

下一节进入 AI 工具与平台。重点从“原理”转向“怎么上手”，把常见的模型服务、开发框架和实际工作流放进一张更实用的地图里。