深度学习简介
约 984 字大约 3 分钟
2026-03-31
这节课解决什么问题
Machine Learning 说明了“模型如何学习”。这一节要回答的是:为什么 Deep Learning 能成为这一轮 AI 爆发的核心方法,以及它和今天的大模型到底是什么关系。
可以先这样理解 Deep Learning
Deep Learning 是建立在多层神经网络上的学习方法。
“深”不是抽象概念,而是网络层数更多、表达能力更强,能够自动从复杂数据里提取更高层次的特征。
和早期大量依赖人工设计特征的方法相比,Deep Learning 更擅长直接处理:
- 文本
- 图片
- 音频
- 视频
- 多模态混合输入
神经网络在做什么
神经网络本质上是在做一连串可学习的变换。
你可以把它想成多层过滤器:
- 第一层学到较浅的模式
- 中间层逐步组合信息
- 更深层形成更抽象的表示
在图像里,浅层可能识别边缘和纹理;在文本里,浅层可能识别词与词的关系,深层则开始理解上下文和语义。
为什么算力、数据和模型规模一起变大后,效果会突然好很多
Deep Learning 的能力不是只靠“方法更新”来的,而是三件事共同推动:
- 数据规模变大
- 算力成本下降
- 模型参数规模持续提升
当这三件事叠加后,模型不再只适合做单点任务,而开始表现出更强的通用能力。
从神经网络到大模型
今天常说的大模型,本质上仍然属于 Deep Learning 的范畴。它们不是完全不同的物种,而是神经网络路线在数据、参数和训练方式上大幅扩展后的结果。
你可以把关系理解成:
- 神经网络:基本结构
- Deep Learning:基于多层神经网络的学习方法
- 大模型:Deep Learning 在大规模数据和算力条件下的产物
Transformer 为什么重要
当前文本与多模态大模型大多建立在 Transformer 架构上。它的重要性在于:
- 更擅长处理长距离上下文关系
- 更适合大规模并行训练
- 更容易扩展到大参数规模
你不需要现在就掌握内部公式,但需要知道:
今天绝大多数 AI × Web3 场景里用到的语言模型、代码模型和多模态模型,背后都离不开这条技术路线。
Deep Learning 的优势和代价
优势
- 能处理复杂、非结构化数据
- 特征工程依赖更低
- 在生成、识别、理解任务上表现强
代价
- 训练和推理成本高
- 对数据规模和质量敏感
- 可解释性相对较弱
- 错误可能更隐蔽,不容易一眼看出
放到 Web3 语境里怎么看
Deep Learning 适合做的事情包括:
- 处理链上交易行为序列
- 分析治理讨论文本
- 生成研究摘要和策略草稿
- 做链上风险识别和模式发现
- 为 Agent 提供决策与执行前的理解能力
但它不适合被神化。
在链上场景里,模型再强,也仍然需要:
- 明确权限边界
- 明确触发条件
- 明确失败回滚逻辑
- 明确人工监督机制
这一节的最小收获
学完后,至少要能说清楚:
- Deep Learning 是什么
- 它与神经网络、大模型之间的关系
- Transformer 为什么重要
- Deep Learning 的优势和代价分别是什么
下一节会接什么
下一节进入 AI 工具与平台。重点从“原理”转向“怎么上手”,把常见的模型服务、开发框架和实际工作流放进一张更实用的地图里。